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INTRODUCCION 


Este  libro  intenta  dar  una  introducción  a  las  ideas  básicas  de  Probabilidades  y  Estadística.  Fue 
concebido  para  ser  usado  por  los  estudiantes  del  ciclo  básico  de  la  Facultad  de  Ciencias  Exactas 
de  la  UNLP  (CiBEx),  con  conocimientos  básicos  de  Análisis  Matemático. 

La  temática  puede  considerarse  dividida  en  dos  núcleos  centrales: 

Nociones  básicas  de  probabilidades:  son  las  herramientas  necesarias  para  desarrollar  las  pri¬ 
meras  nociones  de  inferencia  estadística. 

2.  Algunos  elementos  de  inferencia  estadística:  estimación  puntual  y  mediante  intervalos  de 
confianza,  test  de  hipótesis,  regresión  lineal. 

La  gran  mayoría  de  los  temas  son  introducidos  con  ejemplos,  tratando  de  enfatizar  la  manera 
correcta  de  encararlos. 
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CAPITULO  1 


Probabilidades 


Introducción: 


¿Por  qué  estudiar  Probabilidades? 


La  Teoría  de  Probabilidades  es  una  rama  de  la  Matemática,  que  en  sus  orígenes  se  relacionó 
con  la  resolución  de  problemas  vinculados  con  los  juegos  de  azar.  Sin  embargo,  tiene  aplicaciones 
en  situaciones  muy  diversas,  ya  que  se  utiliza  para  estudiar  cualquier  fenómeno  donde  no  se  puede 
tener  certeza  del  resultado.  Este  tipo  de  fenómeno  se  llama  experimento  aleatorio.  Cuando  se 
realizan  replicaciones  de  cualquier  medición,  por  ejemplo  en  química  clínica,  se  puede  observar 
una  variación  en  los  resultados.  Esta  variación  es  inherente  al  proceso  de  medición.  Entonces,  el 
resultado  de  una  medición  es  incierto,  por  ese  motivo  puede  considerarse  como  un  experimento 
aleatorio.  La  teoría  de  probabilidades  brinda  herramientas  útiles  para  manejar  este  tipo  de  datos. 


Para  ejemplificar  los  primeros  conceptos  de  probabilidad  usaremos  algunos  experimentos  alea¬ 
torios  que  se  refieren  a  juegos  de  azar  simples  como:  arrojar  un  dado,  realizar  un  tiro  de  ruleta, 
sacar  una  bolilla  de  una  caja  con  bolillas  de  diferente  color,  etc. 


5 


Definiciones  y  propiedades  básicas 


Espacio  muestral.  Eventos 

Para  cada  experimento  aleatorio  existe  un  conjunto  de  resultados  posibles,  llamado  espacio 
muestral,  denotado  por  Q. 


Ejemplo  1.1 


El  lanzamiento  de  un  dado  puede  dar  lugar  a  6  resultados:  1,  2,  3,  4,  5,  6,  y  el  espacio  muestral 
o  espacio  de  probabilidad  en  este  caso  es  =  {1, 2, 3, 4, 5, 6}. 


Ejemplo  1.2 


El  espacio  muestral  correspondiente  al  tiro  de  una  ruleta  es  íí  =  {0, 1,2,...,  36}. 


Ejemplo  1.3 


Si  se  extrae  una  bolilla  de  una  caja  que  contiene  bolillas  rojas,  blancas  y  azules,  los  posibles 
resultados  son  los  colores  y  el  espacio  muestral  correspondiente  es  H  =  {roja,  blanca,  azul}. 


Ejemplo  1.4 


Si  se  lanza  una  moneda  tantas  veces  como  sea  necesario  hasta  que  sale  cara  y  designamos,  por 
ejemplo,  XC  al  resultado  “en  el  primer  lanzamiento  sale  ceca  y  en  el  segundo  sale  cara”,  podemos 
escribir  el  espacio  muestral  como  =  {C,  XC,  XXC,  XXXC,  XXXXC, . . .}. 


Ejemplo  1.5 


Si  se  hace  un  tiro  a  un  blanco  circular  de  radio  r  y  se  determinan  las  coordenadas  del  punto  de 
impacto,  los  resultados  posibles  son  todos  los  puntos  del  círculo  (para  simplificar  suponemos  el 
origen  de  coordenadas  en  el  centro  del  círculo).  En  este  caso  el  espacio  muestral  es 

Í2  =  {(a;,  y)  que  verifican  x2  +  y2  <  r2} 
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Observación: 

En  los  Ejemplos  1.1,  1.2  y  1.3  el  espacio  muestral  tiene  un  número  finito  de 
elementos:  6,  37  y  3,  respectivamente.  En  el  Ejemplo  1.4,  el  espacio  muestral 
es  infinito  numerable  (sus  elementos  se  pueden  enumerar),  mientras  que  en  el 
Ejemplo  1.5,  el  espacio  muestral  es  infinito  no  numerable. 


EJERCICIO  1.1 

Describir  en  cada  una  de  las  siguientes  situaciones  el  espacio  muestral,  indicando  si  se  trata  de  un 
espacio  finito,  infinito  numerable  o  infinito  no  numerable. 

1  Se  observa  el  tiempo  en  que  una  máquina  trabaja  sin  romperse. 

2  Se  quiere  contar  la  cantidad  de  clavos  defectuosos  en  cajas  de  100. 

3.  Se  observa  la  cantidad  de  alumnos  inscriptos  en  la  materia  Análisis  de  Datos  de  la  Facultad 
de  Ciencias  Exactas  de  la  UNLP. 


Definición: 

A  los  subconjuntos  de  D  se  los  llama  eventos.  Si  un  evento  está  formado  por  un  único 
resultado  será  un  evento  simple,  en  cambio,  si  consta  de  más  de  un  resultado,  un  evento 
compuesto. 


Ejemplo  1.6 


En  el  Ejemplo  1.1  los  eventos  simples  son:  {1},  {2},  {3},  {4},  {5},  {6};  y  un  ejemplo  de  evento 
compuesto  es  {2,4,6}.  Por  convención,  a  los  eventos  aleatorios  se  los  suele  designar  con  alguna 
de  las  primeras  letras  del  alfabeto  en  mayúscula,  por  ejemplo,  A  =  {2,4,6}.  Gráficamente,  ésto 
sería:  fi 


Evento  compuesto 


Evento  simple 


Esta  grágica  se  conoce  como  Diagrama  de  Venn. 
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El  espacio  muestral  es  también  un  evento  aleatorio,  como  sabemos,  todo  conjunto  es  subconjunto 
de  sí  mismo;  también  lo  es  el  conjunto  vacío  0,  ya  que  está  incluido  en  cualquier  conjunto,  en 
particular  en  Í2. 

Una  vez  realizado  el  experimento,  un  determinado  evento  B  puede  ocurrir  o  no.  Se  dice  que 
ocurre  cuando  el  resultado  del  experimento  es  un  elemento  de  B ,  y  no  ocurre  en  caso  contrario. 
Como  el  evento  U  siempre  ocurre  (por  constar  de  todos  los  resultados),  se  dice  que  es  un  evento 
seguro;  el  evento  0  que  no  consta  de  ningún  resultado,  como  nunca  puede  suceder,  se  dice  que  es 

un  evento  imposible. 

Las  operaciones  y  relaciones  habituales  entre  conjuntos,  tienen  una  traducción  intuitiva  en 
términos  probabilísticos.  Dados  dos  eventos  A  y  B: 

•  la  intersección,  A  D  B,  es  el  evento:  “ A  y  B  ocurren  simultáneamente”; 

•  la  unión,  A  U  B,  es  el  evento:  “ocurre  al  menos  uno  de  los  dos”; 

•  el  complemento  de  A ,  Ac,  es  el  evento:  “no  ocurre  A”; 

•  la  diferencia,  A  —  B  =  A  (~l  Bc,  es  el  evento:  “ocurre  A  pero  no  R”; 

•  si  A  está  incluido  en  B,  A  C  B ,  se  puede  interpretar  que:  “siempre  que  ocurre  A,  ocurre  R”; 

•  si  A  y  B  no  tienen  elementos  en  común,  A  f~l  B  =  0,  entonces:  “ A  y  B  no  pueden  ocurrir 
simultáneamente”  y,  en  este  caso,  se  dice  que  Ay  B  son  eventos  mutuamente  excluyentes, 
disjuntos  o  incompatibles. 

En  cualquier  libro  básico  de  Álgebra  se  pueden  encontrar  las  nociones  fundamentales  de  Teoría 
de  Conjuntos. 


EJERCICIO  1.2 

Para  resolver  los  siguientes  ejercicios  les  recomendamos  realizar  las  gráficas  de  cada  uno. 

1  Sean  Í2  el  conjunto  de  los  enteros  positivos  de  1  a  8,  A  =  {1,  3, 5},  B  =  {1, 4}  y  C  =  {2, 3, 4, 6}. 
Anote  los  elementos  de  los  siguientes  conjuntos:  A  (~|  R,  Cc,  {xGfl:xGCyx^  B}, 
(C  -  Bc)  n  Ac  y  (A  U  B  U  C)c. 

2  Sean  fi={i€l:0<i<  2},  A  =  {x  £  R  :  0.5  <a:<l}yR  =  {a:SlR.:  0.25  <  x  <  1.5}. 
Describa  los  siguientes  conjuntos:  Ac,  ( A  U  B)c,  A  U  Bc,  (A  (~l  B)c  y  Ac  (~l  B. 


Definición  de  Probabilidad.  Axiomas  de  Probabilidad 

Si  bien  ante  un  experimento  aleatorio  no  se  puede  saber  de  antemano  qué  resultado  se  va  a 
obtener,  nos  interesa  disponer  de  algún  número  que  mida  la  posibilidad  de  que  ocurra  cada  uno  de 
los  eventos.  Si  se  lanza  una  moneda  al  aire  n  veces,  una  medida  de  la  posibilidad  de  que  salga  cara 
(evento  C)  podría  ser  la  frecuencia  relativa  de  caras,  es  decir,  el  número  frc  =  nc/n  (donde  nc 
indica  la  cantidad  de  veces  que  se  obtuvo  cara,  es  decir,  el  número  de  ocurrencia  del  suceso  C  en 
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los  n  lanzamientos).  Sin  embargo,  al  lanzar  10  veces  la  moneda,  podría  obtenerse  una  frecuencia 
relativa  de  0.6,  en  tanto  que  al  lanzarla  otras  10  veces  distintas,  podría  conseguirse  un  valor  de  0.4 
o  cualquier  otro  número;  y  no  resultaría  útil  que  la  medida  de  la  posibilidad  de  un  evento  dependa 
de  una  experiencia  particular,  esta  medida  debe  ser  un  número  objetivo.  En  la  siguiente  tabla  se 
muestran  las  frecuencias  relativas  de  caras,  nc/n ,  en  una  realización  de  este  experimento: 


n 

10 

25 

50 

75 

100 

200 

500 

750 

1000 

nc/n 

0.3000 

0.4800 

0.4400 

0.5067 

0.5100 

0.4700 

0.5260 

0.4800 

0.4920 

Se  puede  observar  que  cuando  una  moneda  normal  se  lanza  un  número  de  veces  cada  vez  mayor, 
la  frecuencia  relativa  de  caras  se  va  estabilizando  alrededor  de  un  número  fijo,  0.5.  La  siguiente 
gráfica  muestra  esta  estabilidad,  pero  para  apreciarla  se  han  graficado  los  puntos  ( log(n),nc /n ) 
en  lugar  de  (n,nc/n). 


La  estabilización  de  las  frecuencias  relativas  de  un  evento  alrededor  de  un  número,  ocurre  para 
cualquier  experimento  aleatorio  que  se  repita  muchas  veces.  Una  idea  intuitiva  de  la  probabilidad 
de  un  evento  A,  sería  el  límite  de  las  frecuencias  relativas,  cuando  n  tiende  a  infinito. 

Se  puede  verificar  fácilmente  que  la  frecuencia  relativa  tiene  las  siguientes  propiedades: 

•  0  <  fr^  =  ua/ti  <  1  para  todo  evento  A. 

•  frn  =  rifi/n  =  1  (donde  U  es  el  espacio  muestral). 

•  Ley  aditiva:  Si  los  eventos  Ay  B  son  disjuntos: 

fryUjB  =  TiAuB/n  =  ua/u  +  nB/n  =  ÍTA  +  fr\B 

Entonces,  el  límite  de  esas  frecuencias  heredaría  esas  propiedades. 

Para  que  el  concepto  de  probabilidad  coincida  con  esta  idea  intuitiva,  vamos  a  definirlo  de  modo 
que  cumpla  esas  mismas  propiedades. 
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Definición: 


Dado  un  experimento  aleatorio  con  espacio  muestral  fi,  una  probabilidad  es  una  función 
P ,  que  a  cada  evento  A  de  le  asigna  un  número,  llamado  probabilidad  de  A,  que  se  denota 
P(A),  y  que  verifica: 

(Al)  0  <  P(A)  <  1  para  todo  evento  A. 

(A2)  P(Í2)  =  1. 

(A3)  Ley  aditiva:  Si  los  eventos  Ay  B  son  disjuntos,  es  decir,  Afl  B  =  0, 

P{AUB)  =  P{A)  +  P(B). 

(A4)  Si  Ai,  A-2,  A3,  ...  es  una  colección  infinita  de  eventos  mutuamente  excluyentes,  es 
decir,  A¿  (~l  Aj  =  0,  para  i  ^  j,  entonces: 

OO 

P(A!  UA2UA3U...)=^  P(Aí) 

i= 1 


Aclaración 

A  partir  del  (A3),  se  puede  generalizar  la  propiedad  aditiva  para  n  eventos  mutuamente  exclu¬ 
yentes,  pero  no  puede  generalizarse  para  una  colección  infinita  numerable  de  eventos,  por  eso, 
para  trabajar  con  espacios  muéstrales  infinitos,  es  necesario  agregar  el  (A4). 


A  partir  de  esta  definición  de  probabilidad,  pueden  deducirse  varias  propiedades  de  manera 
bastante  simple. 


Algunas  propiedades  básicas 


PROPIEDAD  1.1:  Para  cualquier  evento  A,  P{A)  =  1  —  P(AC). 


Demostración  Por  definición  de  Ac: 

AuAc  =  DyAnAc  =  0 

Por  (A2)  y  (A3) 

1  =  P(ü)  =  P(A  U  Ac)  =  P(A)  +  P(AC) 
Despejando  P(A):  P(A)  =  1  -  P(AC). 


n 
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En  particular:  si  A  =  0,  se  cumple  que  P(0)  =  O,  ya  que  Ac  =  Í2.  Es  importante  notar  que  el 
recíproco  no  es  verdadero.  Si  P{A)  =  0  no  se  puede  concluir  que  A  =  0,  veremos  más  adelante  que 
hay  eventos  no  vacíos  que  pueden  tener  probabilidad  cero. 

PROPIEDAD  1.2:  Para  dos  eventos  cualesquiera  A  y  B1  P(B  —  A)  =  P(B)  —  P(A  (~l  B). 

En  particular,  si  A  C  B,  P(B  —  A)  =  P(B)  —  P{A)  y  P(B)  >  P(A). 


Demostración:  El  evento  B  puede  escribirse  como: 

B  =  (AHB)U(Bn  Ac ) 

donde  (A D  B)  =  I  I  y  (. B  fl  Ac)  =  I  I  son  disjuntos.  Luego,  por 

(A3): 

P(B)  =  P{A  n  B)  +  P{B  n  Ac). 

Despejando  P{B  fl  Ac )  =  P(B)  —  P(A  fl  B).  Por  último,  por  la  Propiedad  del  complemento  en 
el  Apéndice  A,  B  —  A  =  B  fl  Ac,  por  lo  tanto  P(B  —  A)  =  P(B)  —  P(A  fl  B). 

En  el  caso  que  A  esté  contenido  en  B,  A  C  B,  tenemos  que  A  fl  B  =  A,  entonces 

P(B-A)  =  P(B)-P(A),  (1.1) 

por  el  resultado  anterior.  Despejando  de  (O)  tenemos  que  P{B)  =  P{A)  +  P(B  —  A).  Luego, 
como  P(B  -  A)  >  0  por  (Al):  P{B)  =  P{A)  +  P(B  —  A)  >  P{A). 


Í2 


PROPIEDAD  1.3:  Para  dos  eventos  cualesquiera  A  y  B, 

P(A  U  B)  =  P{A)  +  P(B)  -  P(A  n  B) 


I  Demostración  Primero  observemos  que  A\jB  =  AU(Bn  Ac ), 

donde  A  =  □  y(Bn  Ac )  =  □  son  disjuntos. 

Por  (A3): 

P(A  U  B)=  P[A  U  (B  n  Ac)\  =  P(A)  +  P{B  n  Ac)  (1.2) 

Recordemos  que,  en  la  Propiedad  1.2,  se  llegó  al  siguiente  resultado: 

P{B  n  Ac)  =  P(B)  -  P(A  n  B) 

Reemplazando  ésto  en  m,  se  obtiene: 

P(A  U  B)=  P{A)  +  P(B  n  Ac)  =  P{A)  +  P(B)  -  P{A  n  B) 

Notar  que  si  A  fl  B  =  0,  en  esta  última  propiedad,  obtenemos  (A3). 


12 


11 


Aclaración 


Para  tres  eventos  cualesquiera  A,  B  y  C,  la  probabilidad  de  la  unión  es: 

P{A  UBI)  C)  =  P(A)+P{B)+P(C)-P{A  n  B)  —  P(A  n  C)-P{B  n  C)+P(A  n  B  n  C) 
Para  demostrarlo  formalmente,  se  puede  escribir  AUBUC  como  (A  U  B)  U  C  y  aplicar  la 
Propiedad  1.3. 


f! 


EJERCICIO  1.3 

En  los  siguientes  ejercicios  aplicar  las  propiedades  anteriores. 

1  Sean  Ay  B  dos  eventos  disjuntos  tales  que  P(B)  =  0.72  y  P(AnBc)  =  0.02.  Calcular  P(A) 
yP(AuB). 

2,  Determinar  si  las  siguientes  afirmaciones  son  falsas  o  verdaderas.  Justificar  su  respuesta. 

•  Si  P(A)  >  0,  entonces  P(A  U  B)  >  0. 

•  Si  P(A)  >  1/2  y  P{B)  >  1/2,  entonces  P(A  n5)>0. 

•  Si  P(A)  >  0,  entonces  P(AC)  >  0. 

•  P(B  U  A)  =  P(B)+P(A). 


Determinación  de  probabilidades  en  espacios  muéstrales 
finito  o  infinito  numerables 

Cuando  el  espacio  muestral  es  finito  o  infinito  numerable,  para  definir  una  probabilidad  sobre 
todos  los  eventos,  es  suficiente  asignar  probabilidades  P(Ei)  para  todos  los  eventos  simples  2£¿. 
Esta  asignación  debe  satisfacer: 

•  P(Ei)  >  0 

.  22p(Eí)  =  1 

i 

Entonces,  por  (A3),  la  probabilidad  de  cualquier  evento  compuesto  A  se  calcula  sumando  las 
P(Ei )  para  todos  los  en  A 

P(A)  =  p{Ei) 

EiCA 
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Ejemplo  1.7 


Consideremos  el  experimento  que  consiste  en  tirar  un  dado  que  no  está  bien  equilibrado,  y  resulta 
que  cualquiera  de  los  resultados  pares  tiene  el  doble  de  probabilidad  de  ocurrir  que  cualquiera 
de  los  resultados  impares. 

Llamamos  E\,  E2,  E3,  EA,  E5  y  E6  a  los  eventos  simples  {1},  {2},  {3},  {4},  {5}  y  {6}, 
respectivamente.  La  única  asignación  de  probabilidades  posible  deberá  cumplir: 

•  P(E{)  =  P{E3)  =  P{E5)  =  1/9 

.  P(E2)  =  P{E4)  =  P{E6)  =  2/9 

Luego,  la  probabilidad  de  cualquier  evento  se  calcula  a  partir  de  esos  eventos  simples.  Por 
ejemplo,  para  el  evento 

A  =  “el  resultado  es  par”  =  {2, 4,  6}  =  {2}  U  {4}  U  {6}  =  E2  U  E4  U  Eq, 

luego 

P{A)  =  P(E2  Ufi4U  E6)  =  P(E2)  +  P(EA)  +  P{E6)  =  6/9  =  2/3 

Para 

B  =  “el  resultado  es  menor  o  igual  a  3”  =  {1,  2, 3}  =  {1}  U  {2}  U  {3}  =  Ei  U  E2  U  E3, 
entonces 

P(B)  =  P(£d  UB2U  E3)  =  P(£d)  +  P(E2)  +  P{E3)  =  1/9  +  2/9  +  1/9  =  4/9 


EJERCICIO  1.4 

Resolver  los  siguientes  ejercicios: 

Sean  Ay  B  dos  eventos  tales  que:  P(^4)  =  0.2,  P(B)  =  0.3  y  P(A  fl  B)  =  0.1.  Calcular: 

•  P{Al)B) 

•  P{ACUBC) 

•  P{AnBc) 

•  P{ACUB) 

2.  Se  construye  un  dado  de  manera  que  el  1  y  el  2  ocurran  con  el  doble  de  frecuencia  que  se 
presenta  el  5,  el  cual  ocurre  con  la  frecuencia  3  veces  superior  al  3,  al  4  o  al  6.  Si  se  lanza  una 
vez,  ¿cuál  es  la  probabilidad  de  que  el  número  sea  par?  y  ¿cuál  es  la  probabilidad  de  que  el 
número  sea  mayor  que  4? 
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Espacios  equiprobables 


Definición: 

Un  espacio  muestral  finito,  se  dice  equiprobable,  si  todos  los  eventos  simples,  £},  tienen 
la  misma  probabilidad.  En  ese  caso,  para  que  se  cumplan  las  condiciones: 

•  P(Ei)  >  0 

n 

•  '£p(eí)  =  i 

¿=i 

la  única  posible  asignación  de  probabilidades  debe  ser:  P(U¿)  =  1/n,  donde  n  es  el  número 
de  elementos  del  espacio  muestral. 


Entonces,  si  A  es  un  evento  que  está  formado  por  k  eventos  simples, 


P(A)  =  P(Ei )  =  L- 

EZCA  U 

En  consecuencia,  en  un  espacio  muestral  finito  equiprobable,  la  probabilidad  de  un  evento  se 
calcula  como  el  número  de  resultados  que  forman  ese  evento  dividido  por  el  número  de  resultados 
de  todo  el  espacio  muestral: 


P(A) 


±A 

#u 


Ejemplo  1.8 


Consideremos  el  experimento  que  consiste  en  tirar  un  dado  equilibrado,  en  este  caso  #  =  6  y 

los  6  resultados  tienen  igual  probabilidad,  1/6. 

Sea  A  =  “sale  un  número  par”  =  {2,4,6},  entonces 

p(A>  =f^3/6 

Sea  B  =  “sale  un  número  menor  que  5”  =  {1,  2,  3,4},  entonces 

P(B)  =  ||  =  4/6 


Ejemplo  1.9 


Consideremos  el  experimento  que  consiste  en  arrojar  dos  veces  un  dado  equilibrado,  para  este 
experimento  podemos  escribir  el  espacio  muestral  como: 

íl  =  {(a;,  y)  :  donde  x  e  y  £  { 1,2,...,  6}} 

=  {(1, 1);  (1,  2); . . . ;  (1, 6);  (2, 1);  (2,  2); . . . ;  (2, 6); . . . ;  (6, 1);  (6, 2); . . . ;  (6,  6)} 
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Este  espacio  muestral  es  equiprobable  y  tiene  36  eventos  simples,  cada  uno  con  probabi¬ 
lidad  1/36.  Sea  el  evento  A  =  “la  suma  de  los  dos  resultados  es  menor  que  6”, 


A  =  {(1, 1);  (1,  2);  (2, 1);  (1,  3);  (3, 1);  (1, 4);  (4, 1);  (2,  2);  (2,  3);  (3,  2)} 


entonces  P(A)  =  10/36. 


Ejemplo  1.10 


Consideremos  el  experimento  aleatorio  que  consiste  en  sacar  una  bolilla  de  una  caja  que  contiene 
4  bolillas  blancas,  4  rojas  y  2  azules.  Podemos  pensar  el  espacio  muestral  formado  por  todas  las 
extracciones  posibles  que  son  10,  y  todas  tienen  igual  probabilidad  1/10. 

Luego  si  definimos  el  evento  B  =  “sale  una  bolilla  blanca”,  la  P(B)  =  4/10  =  0.4. 

En  general  si  en  la  caja  hay  un  40%  de  bolillas  blancas,  P(B)  =  0.4. 


Ejemplo  1.11 


Consideremos  que  deseamos  calcular  la  probabilidad  de  que  un  individuo  elegido  en  una  pobla¬ 
ción  tenga  determinada  característica.  Supongamos  que  se  conoce  que  el  46  %  de  los  individuos 
de  una  población  tienen  sangre  del  grupo  O,  el  43%  del  grupo  A,  el  8%  del  grupo  B  y  el  3% 
del  grupo  AB.  Se  elige  una  persona  al  azar  en  dicha  población,  esto  significa  que  todos  los  indi¬ 
viduos  tienen  la  misma  probabildad  de  ser  elegido.  Como  sabemos  que  el  46  %  de  los  individuos 
tiene  grupo  O,  la  probabilidad  de  que  el  individuo  elegido  tengo  grupo  O  es  0.46.  Del  mismo 
modo  la  probabilidad  de  que  tenga  sangre  grupo  A  es  0.43  y  la  probabilidad  de  que  tenga  sangre 
grupo  A  o  grupo  B  es  0.51  (dado  que  tener  sangre  grupo  A  o  tener  sangre  grupo  B  son  eventos 
incompatibles  o  disjuntos). 


EJERCICIO  1.5 

En  una  repisa  hay  10  libros  distintos  de  novelas  y  20  libros  distintos  de  cuentos,  de  los  cuales  la 
mitad  de  las  novelas  y  la  mitad  de  los  cuentos  están  escritos  en  español.  Si  se  selecciona  uno  de 
estos  libros  al  azar,  hallar  la  probabilidad  de  que: 

•  el  libro  seleccionado  sea  una  novela; 

•  el  libro  seleccionado  este  escrito  en  español; 

•  el  libro  seleccionado  sea  una  novela  y  este  escrito  en  español; 

•  el  libro  seleccionado  sea  una  novela  o  este  escrito  en  español. 
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Probabilidad  condicional 


Consideremos  el  siguiente  ejemplo:  se  arroja  dos  veces  un  dado,  entonces  el  espacio  muestral  se 
puede  definir  como 

Cl  ={{i,j)  :  i  es  el  número  del  primer  tiro  y  j  el  número  del  segundo  tiro, 
con  i.  j  =  1,  2,  3, 4, 5, 6}. 

Nos  interesa  calcular  la  probabilidad  del  evento 


A  =  “la  suma  de  los  dos  resultados  es  mayor  que  8” 

=  {(3, 6);  (4,  5);  (4, 6);  (5, 4);  (5, 5);  (5,  6);  (6, 3);  (6, 4);  (6,  5);  (6, 6)} 


Si  el  dado  es  equilibrado  P(A)  =  10/36. 


n 


Ahora  supongamos  que  sabemos  que  en  el  primer  tiro  salió  un  2,  es  decir,  ocurrió  el  evento 


R  —  “oí 


y  en  ninguno  de  estos  posibles  resultados  la  suma  puede  ser  mayor  que  8.  Con  esta  información  es 
imposible  que  la  suma  sea  mayor  que  8.  Usamos  la  notación  P(A\B)  para  indicar  la  probabilidad 
de  que  ocurra  A,  sabiendo  que  ocurrió  B.  Entonces,  en  este  caso,  P{A\B)  =  0. 

Por  otra  parte,  si  sabemos  que  en  el  primer  tiro  salió  5,  o  sea  ocurrió 


C=  {(5,1);  (5, 2);  (5,  3);  (5, 4);  (5,  5);  (5,  6)} 


y  sólo  en  tres  de  ellos  se  cumple  que  la  suma  es  mayor  que  8,  entonces  P(A\C)  =  3/6. 


Consideremos  otro  ejemplo,  se  selecciona  al  azar  un  recién  nacido  y  se  realiza  un  análisis  para 
diagnosticar  hipotiroidismo  congénito  (HC).  Sea  A  =  “el  recién  nacido  padece  HC”,  la  P(A)  es 
igual  a  la  proporción  de  recién  nacidos  con  HC  en  la  población.  Ahora  bien,  si  observamos  que  el 
recién  nacido  es  una  niña  (sea  B  =  “el  recién  nacido  es  de  sexo  femenino” )  y  queremos  conocer  la 
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probabilidad  de  que  padezca  HC,  esto  es  la  proporción  de  recién  nacidos  con  HC  en  esa  subpoblación 
(recién  nacidos  de  sexo  femenino).  En  este  ejemplo  P{A\B)  >  P(A),  pues  es  sabido  que  el  HC  es 
más  frecuente  en  las  niñas. 

Dado  que  ocurrió  B1  el  espacio  muestral  pertinente  ya  no  es  fl  sino  que  consiste  en  los  resultados 
de  B.  En  este  caso,  A  ocurre  si  y  sólo  si  ocurre  uno  de  los  resultados  de  la  intersección  A  D  B,  así 
que  la  probabilidad  condicional  de  A  dado  B  es  proporcional  a  P(A  D  B). 


Definición: 


Dados  dos  evento  A  y  B,  si  P(B)  >  0  se  define  P(A\B)  como: 

P(A  n  B) 


P{A\B)  = 


P(B) 


Obviamente,  si  P(A)  >  0,  también  puede  definirse 

P(B  O  A) 


P(B\A)  = 


P(A) 


Se  puede  probar  que  fijando  el  evento  condicionante  B:  la  probabilidad  condicional  dado  B , 
cumple  los  axiomas  de  probabilidad: 


(Al)  0  <  P{A\B)  <  1  para  cualquier  A 

(A2)  P(Ü\B)  =  1  (donde  Q  es  el  espacio  muestral) 

(A3)  Ley  aditiva:  Si  los  eventos  Ay  C  son  disjuntos: 

P(A  U  C\B)  =  P(A\B)  +  P[C\B). 


(A4)  Si  Ai,  A2,  A3,  . . .  es  una  colección  infinita  de  eventos  mutuamente  exc.luyentes,  entonces 

OO 

P(A!  ua2ua3u...\b)  =  J2  p(Mb)- 

i= 1 

Por  lo  tanto,  tiene  todas  las  propiedades  de  una  probabilidad. 


Ejemplo  1.12 


Supongamos  que  en  la  población  general  hay  49%  de  hombres  y  51%  de  mujeres,  y  que  la 
proporción  de  hombres  y  mujeres  daltónicos  se  muestra  en  la  siguiente  tabla  de  probabilidad: 


Datos 

Hombres 

Mujeres 

Total 

Daltónicos 

0.038 

0.002 

0.040 

No  daltónicos 

0.452 

0.508 

0.960 

Total 

0.490 

0.510 

1 

Si  se  escoge  al  azar  una  persona  de  esta  población  y  se  encuentra  que  es  hombre  (evento 
B  =  “la  persona  seleccionada  es  hombre” ) ,  ¿cuál  es  la  probabilidad  de  que  sea  daltónica  (evento 
A  =  “la  persona  seleccionada  es  daltónica”)? 
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Sabiendo  que  B  ha  ocurrido,  debemos  restringir  nuestra  atención  a  sólo  49  %  de  la  población 
que  es  de  hombres.  La  probabilidad  de  ser  daltónico,  dado  que  la  persona  es  hombre,  es: 

P(A\B)  =  P(A  n  B)/P(B)  =  0.038/0.49  =  0.078 

Significa  que  si  sabemos  que  la  persona  seleccionada  es  hombre,  este  hecho  aumenta  la  pro¬ 
babilidad  de  que  sea  daltónico  que  era  0.04. 

Ahora  nos  preguntamos,  ¿cuál  es  la  probabilidad  de  ser  daltónico,  dado  que  la  persona  es 
mujer?  En  este  caso  estamos  restringiendo  a  sólo  el  51  %  de  la  población  que  es  de  mujeres  y  pol¬ 
lo  tanto: 


P(A\BC)  =  P(A  n  BC)/P(BC)  =  0.002/0.51  =  0.004 

Podemos  deducir  de  este  cálculo  que  la  información  adicional  de  que  la  persona  seleccionada  es 
mujer,  disminuye  la  probabilidad  de  que  sea  daltónica. 


EJERCICIO  1.6 

Determinar  si  las  siguientes  afirmaciones  son  falsas  o  verdaderas.  Justificar  su  respuesta. 
1  P{A\B)  +P(AC\B)  =  1. 

2.  P{A\B)  +P(A\BC)  =  P{A). 

3.  P(A\A  n  B)  =  P{B\A  HB)  =  1. 

4.  P{A\A)  =  P(A). 

Si  B  y  C  son  eventos  disjuntos,  P(A\B  UC)  =  P(A\B)  +  P(A\C). 

6.  Si  A  y  B  son  eventos  disjuntos,  P{A  U  B\C)  —  P{A\C)  +  P(B\C). 


Regla  de  la  multiplicación 


A  partir  de  la  definición  de  probabilidad  condicional  podemos  deducir  dos  ecuaciones: 


•  si  P{B)  >  0,  P(A\B)  =  P{A  n  B)/P{B)  implica  que  P{A  n  B)  =  P(A\B)  x  P(B), 

•  si  P(A)  >  0,  P(B\A)  =  P(A  n  B)/P(A)  implica  que  P(A  n  B)  =  P{B\A)  x  P(A). 


Formalizando: 
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REGLA  DE  LA  MULTIPLICACIÓN:  Dados  dos  eventos  Ay  B  la  probabilidad  de  la 
intersección  puede  calcularse  como: 

P(A  n  B)  =  P(A\B)  x  P(B)  =  P(B\A)  x  P(A), 

cuando  estén  definidas  las  respectivas  probabilidades  condicionales. 


La  extensión  de  la  regla  anterior  a  tres  eventos  es: 

p(A  n  b  n  c)  =  P(C\A  n  b)  x  p{b\A)  x  p(á), 

y  de  modo  similar  para  más  de  tres. 


Ejemplo  1.13 


En  un  banco  de  sangre,  4  individuos  han  respondido  a  una  solicitud.  Se  necesita  sangre  tipo  A+ 
y  sólo  uno  de  ellos  tiene  ese  tipo,  pero  no  se  sabe  cuál.  Si  los  donantes  potenciales  se  seleccionan 
al  azar  para  determinar  su  tipo  sanguíneo,  ¿cuál  es  la  probabilidad  de  que  haya  que  determinar 
el  tipo  sanguíneo  en  al  menos  tres  individuos  para  obtener  el  tipo  deseado? 

Llamemos  B  =  “primer  donante  no  es  A+”  y  A  =  “segundo  donante  no  es  A+”,  sabemos 
que  P{B)  =  3/4  y  P(A\B)  =  2/3.  El  evento  A  (~l  B  es: 

A  n  B  =  “ni  el  primero  ni  el  segundo  son  tipo  A+” 

=  “se  determina  el  tipo  sanguíneo  en  al  menos  tres  individuos” . 

Usando  la  Regla  de  la  multiplicación: 

P(A  HB)  =  P(A\B)  x  P(B)  =  2/3  x  3/4  =  1/2 


Eventos  independientes 


Si  volvemos  al  Ejemplo  1.12,  del  daltonismo  y  el  género,  hemos  visto  que  P(A\B)  ^  P(A ),  con 
lo  cual  la  probabilidad  de  que  la  persona  elegida  al  azar  sea  daltónica  sabiendo  que  es  hombre  es 
distinto  a  la  probabilidad  de  que  esa  persona  sea  daltónica  sin  saber  su  género.  Es  decir,  saber  que 
la  persona  elegida  al  azar  es  hombre  modifica  la  probabilidad  de  que  sea  daltónica.  Eso  indicaría 
que  hay  alguna  relación  o  dependencia  entre  los  eventos  B  y  A. 

Pensemos  en  otro  ejemplo. 


19 


Ejemplo  1.14 


Se  tira  un  solo  dado  dos  veces  y  los  eventos  de  interés  son:  A  =  “se  observa  un  2  en  el  primer 
tiro”  y  B  =  “se  observa  un  2  en  el  segundo  tiro”.  Si  el  dado  no  está  cargado,  la  probabilidad  del 
evento  A  es  1/6,  y  es  lógico  pensar  que  la  probabilidad  de  B  también  es  1/6  sin  importar  si  en 
el  primer  tiro  ocurrió  A  o  no,  es  decir  P(B)  =  P(B\A)  =  P{B\AC),  eso  significa  que  los  eventos 
A  y  B  no  están  relacionados  o  que  son  “independientes”. 


Daremos  una  definición  de  independencia  ligeramente  distinta. 

Definición: 

Los  eventos  Ay  B  son  independientes  si  y  sólo  si  P(A  fi  B)  =  P{A)  x  P(B). 


A  partir  de  esta  definición  de  independencia,  se  puede  ver  que  si  A  y  B  son  eventos  indepen¬ 
dientes  y  P(B)  >  0,  se  cumple  P(A\B)  =  P(A). 

La  demostración  es  elemental,  ya  que 


P{A\B)  = 


P(AnB) 

P(B) 


P{A)  x 

PJ& 


P(A). 


Entonces  la  definición  de  independencia  coincide  con  la  idea  intuitiva  de  que  saber  que 
ocurrió  B,  no  modifica  la  probabilidad  de  que  ocurra  A. 


Definición: 

Decimos  que  los  tres  eventos  A,  B  y  C  son  mutuamente  independientes  si  y  sólo  si 
todas  las  condiciones  siguientes  se  mantienen: 

P(A  D  B)  =  P(A)  x  P(B) 

P(AnC)  =  P(A)  x  P(C) 

P(BHC)  =  P(B)  x  P(C) 

P{A  n  B  n  C)  =  P{A)  x  P(B)  x  P(C) 


Definición: 

Los  n  eventos  Ai,  A 2,  . . .,  An  son  mutuamente  independientes  si  para  todo  k 
(k  =  2,  3, . . . ,  n)  y  todo  subconjunto  de  índices  i\,  ¿2,  . . .,  **,,  se  cumple: 

p(4nAÍ2n...n4)  =  P(Ah)  x  p(a12)  x  ■■■  x  P(Aik) 
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Observación: 

La  definición  de  independencia  indica  que  si  queremos  verificar  si  dos  eventos 
|  son  independientes,  debemos  ver  que  la  probabilidad  de  la  intersección  es  el 

•  producto  de  las  probabilidades.  Sin  embargo,  cuando  por  la  naturaleza  del  ex¬ 

perimento  aleatorio  sabemos  que  hay  independencia,  como  los  dos  tiros  de  un 
dado,  esta  definición  nos  permite  calcular  la  probabilidad  de  la  intersección  como 
el  producto  de  las  probabilidades. 

En  el  Ejemplo  1.14,  del  dado,  podemos  calcular  P(A  fl  B)  =  1/6  x  1/6. 

Por  supuesto,  si  dos  eventos  no  son  independientes,  la  probabilidad  de  que  ocurran  simultánea¬ 
mente  no  es  el  producto.  Por  ejemplo,  si  la  probabilidad  de  que  un  hombre  tenga  una  altura 
superior  a  1.80  m  es  0.2,  la  probabilidad  de  que  un  padre  y  un  hijo  tengan  altura  superior 
a  1.80  iTi  no  es  0.2  x  0.2,  ya  que  estos  eventos  no  son  independientes  (sabemos  que  la  altura 
de  los  hijos  están  relacionadas  con  la  altura  de  los  padres). 

PROPOSICIÓN  1.1:  Dados  dos  eventos  A  y  B,  las  siguientes  afirmaciones  son 

equivalentes: 

•  A  y  B  son  independientes. 

•  A  y  Bc  son  independientes. 

•  Ac  y  B  son  independientes. 

Ac  y  Bc  son  independientes. 


I  Demostración  Comenzamos  probando  que  la  independencia  de  A  y  B  implica  la  de  A  y  Bc. 
Recordar  primero  que  A  =  (A  fl  B)  U  (A  fl  Bc ),  con  ambos  conjuntos  disjuntos.  Luego,  aplicando 
probabilidad,  nos  queda  P(A)  =  P(A  fl  B)  +  P(A  fl  Bc),  por  (A3). 

Ahora,  despejando  y  sabiendo  que  Ay  B  son  independientes,  tenemos 


P{A  n  Bc)  =  P(A)  -  P(A  n  B) 

=  P(A)  -  P(A)  x  P(B) 
=  P(A)  x  [1  -  P(B)] 

=  P(A)  x  P{BC) 


(utilizando  la  Propiedad  1.2) 
(por  hipótesis) 
(sacando  factor  común) 
(utilizando  la  Propiedad  1.1) 


es  decir,  A  y  Bc  son  independientes. 

Aplicando  este  razonamiento  a  los  eventos  Ay  Bc,  resulta  que  la  independencia  de  A  y  Bc  implica 
la  de  A  y  ( Bc)c  =  B ,  lo  que  prueba  la  implicación  opuesta.  En  consecuencia,  hemos  demostrado 
que  son  equivalentes:  Ay  B  son  independientes  y  A  y  Bc  son  independientes. 

De  la  primera  equivalencia  salen  las  otras  dos. 
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EJERCICIO  1.7 


1  Sean  Ay  B  eventos  independientes  tales  que  P{A)  =  0.3  y  P{B)  =  0.24.  Calcular: 

•  P(A  (~l  B) 

•  P{Al)B) 

•  P{Al)Bc) 

•  P(A\BC ) 

2  Sea  f l  =  {1,2, 3, 4}  un  espacio  muestral  equiprobable.  Dados  los  eventos: 

A  =  {1,2},  B  =  {  2,3}  y  C  =  {2,4}. 

¿Son  A,  B  y  C  independientes? 

3  Sean  Ay  B  eventos  independientes.  Demostrar  que  P(A  U  B)  =  1  —  P(AC)  x  P(BC). 


Teorema  de  la  Probabilidad  Total.  Teorema  de  Bayes 


Definición: 

Los  eventos  A\,A2,...  ,An  representan  una  partición  del  espacio  muestral  Q,  si  cum¬ 
plen: 

n 

(a)  U  A2  U  . . .  U  An  =  |J  Ai  =  n  y 

í—í 

(b)  Ai  fl  Aj  =  0  para  todo  i  ^  j. 


TEOREMA  DE  LA  PROBABILIDAD  TOTAL:  Si  Ai,  A2, . . .  ,An  representan  una 
partición  del  espacio  muestral  fl.  Y  además,  P(A,)  7^  0  para  todo  i.  Entonces,  para  cualquier 
evento  B ,  se  cumple: 

P(B)  =  P(B\Ai)P(Ai)  +  P(B\A2)P(A2)  +  ■■■+  P(B\An)P(An) 

n 

=  YJP{B\Al)P{Al). 

i= 1 


Demostración:  Como  los  constituyen  una  partición  del  espacio  fl,  (por  (a)),  cualquier  evento 
B  puede  escribirse  como: 
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Utilizando  la  propiedad  distributiva  de  la  intersección  respecto  de  la  unión,  tenemos  que: 


B  n  [A1  U  A-2  U  . . .  U  An)  =  (B  n  A±)  u  (B  n  A2)  U  . . .  U  (B  n  An), 


por  lo  tanto: 


B  =  (5ndi)u(5ni2)u...u(Bn  An). 

Como  los  eventos  ( B  D  Ai),(B  fl  A2), . . .  ,(B  fl  An)  son  mutuamente  excluyentes  (por  (b)), 
podemos  aplicar  la  Ley  aditiva  y  escribir: 

P{B)  =  p((b  n  Ai)  u  (B  n  a2)  u  . . .  u  {b  n  An)) 

=  p(b  n  A±)  +  p(b  n  a2)  +  ■  ■  •  +  p(b  n  An). 

Por  la  Regla  de  la  multiplicación,  cada  término  P(B  fl  Ai)  =  P(B\Ai)P(Ai)  y  reemplazando, 
obtenemos: 

P(B)  =  P(B\AÍ)P(A1)  +  P(B\A2)P(A2 )  +  •  •  •  +  P(B\An)P(An). 


Ejemplo  1.15 


En  cierta  comunidad,  el  8  %  de  los  adultos  de  más  de  50  años  de  edad  padece  diabetes.  Se  conoce 
que  la  prueba  para  diagnosticar  esa  enfermedad  tiene  una  sensibilidad  del  95  %  (esto  significa 
que  si  la  prueba  se  aplica  a  un  individuo  enfermo,  la  probabilidad  de  un  resultado  positivo  es 
0.95)  y  la  especificidad  es  del  98  %  (la  probabilidad  de  obtener  un  resultado  negativo  dado  que 
el  individuo  es  sano  es  0.98). 

Recordemos  que  la  prevalencia  de  una  enfermedad  en  una  población  se  define  como  la  pro¬ 
porción  de  enfermos  en  la  población,  y  suele  expresarse  como  porcentaje.  En  consecuencia,  si  se 
elige  una  persona  al  azar,  la  probabilidad  de  que  esté  enferma  es  igual  a  la  prevalencia. 

Supongamos  que  se  va  a  utilizar  esta  prueba  diagnóstica  en  un  gran  número  de  individuos 
de  más  50  años  elegidos  al  azar  en  esa  comunidad,  y  se  quiere  tener  una  idea  de  la  proporción 
de  resultados  positivos  que  se  obtendrán.  Esto  es  equivalente  a  calcular  la  probabilidad  de  que 
la  prueba  diagnóstica  de  un  resultado  positivo  en  uno  de  esos  individuos. 

Es  conveniente  definir  los  eventos  que  usaremos  para  resolver  este  problema.  Llamemos: 
R+  =  “el  resultado  de  la  prueba  es  positivo” ,  R~  =  “el  resultado  es  negativo” ,  D  =  “el  individuo 
tiene  diabetes”  y  ND  =  “el  individuo  no  tiene  diabetes”. 
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Conocemos  lo  siguiente: 


Prevalencia  =  P(D)  =  0.08,  entonces  P(ND)  =  0.92 
Sensibildad  =  P(R+\D)  =  0.95,  entonces  P(R~\D)  =  0.05 
Especificidad  =  P(R~\ND )  =  0.98,  entonces  P(R+\ND)  =  0.02 

y  queremos  calcular  P(P+). 

En  este  caso,  D  y  ND  son  eventos  disjuntos  y  también  D  U  ND  =  Í2,  esto  significa  que 
constituyen  una  partición  del  espacio,  que  en  este  caso  es  toda  la  población  de  referencia. 
Entonces  podemos  escribir: 


R+  =  R+  n  (D  U  ND) 

=  (R+  n  D)  u  (P+  n  ND) 


Aplicando  la  Ley  aditiva  en  (1)  y  la  Regla  de  la  multiplicación  en  (2): 

P(P+)  =  P(P+  n  D)  +  P(P+  n  ND) 

=  P(R+\D)  x  P(D)  +  P(R+\ND)  x  P{ND). 

Ahora,  reemplazando  por  los  valores,  tenemos: 

P{R+)  =  0.95  x  0.08  +  0.02  x  0.92  =  0.0944. 

■ 

El  procedimiento  que  utilizamos  en  este  ejemplo  es  una  aplicación  del  Teorema  de  la  Probabi¬ 
lidad  Total. 


TEOREMA  DE  BAYES:  Si  A\,  A2, . . . ,  An  representan  una  partición  del  espacio  mues- 
tral  fl,  donde  P(A¿)  >  0  para  todo  i,  y  sea  B  un  evento  cualquiera  con  P(B)  >  0,  entonces 
para  cualquier  k  =  1, . . . ,  n,  se  cumple: 


P(Ak\B) 


P{B\Ak)P{Ak) 

n 

Í=  1 


Demostración  Primero,  por  la  definición  de  probabilidad  condicional  tenemos  que: 


P(Ak\B)  = 


P(Ak  n  B) 
P{B) 


(1.3) 


Segundo,  como  tenemos  las  mismas  hipótesis  que  en  el  Teorema  de  la  Probabilidad  Total,  podemos 
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afirmar  que: 


P{B)  =  Y,P(B\Ai)P(Ai)  (1.4) 

2=1 

Tercero,  si  aplicamos  la  Regla  de  la  multiplicación  al  numerador  de  &  tenemos  que: 


P(AknB)  =  P{B\Ak)P{Ak)  (1.5) 

Por  líltimo,  reemplazando  en  El  los  resultados  de  El  y  El,  podemos  concluir  que: 

Y,P(B¡A,)PIA) 

2=1 


Ejemplo  1.16 


Volviendo  al  Ejemplo  1.15,  supongamos  que  al  individuo  elegido  al  azar  se  le  realizó  la  prueba 
diagnóstica,  y  esta  dio  un  resultado  positivo,  ¿cuál  es  la  probabilidad  de  que  dicho  individuo 
tenga  realmente  diabetes? 

Ahora  lo  que  se  desea  es  calcular  P(D\R+),  si  aplicamos  la  definición  de  probabilidad  condi¬ 
cional: 

calculamos  P{D  fl  R+)  por  la  Regla  de  la  multiplicación  y  reemplazamos  P{R+)  que  ya 
calculamos  previamente,  tenemos: 

P{D\R+)  = 


P{R+\D)P(D) 


P(R+\D)P(D)  +  P(R+\ND)P(ND) 

Esto  se  suele  llamar  valor  predictivo  positivo  (VPP)  de  una  prueba  diagnóstica,  es  la  pro¬ 
babilidad  de  que  el  individuo  este  enfermo  dado  que  la  prueba  dio  un  resultado  positivo.  En 
nuestro  caso: 

p'°i!,'  =  w=“1 

De  la  misma  manera  se  define  el  valor  predictivo  negativo  (VPN)  de  una  prueba  diagnóstica, 
que  es  la  probabilidad  de  que  el  individuo  esté  sano  dado  que  el  resultado  de  la  prueba  fue 
negativo: 

P(ND\R~)  = 


P(R~\ND)P{ND) 


P(R-\D)P(D)  +  P(R~\ND)P(ND) 


Este  ejemplo  fue  una  aplicación  del  Teorema  de  Bayes. 


EJERCICIO  1.8 

Resolver  los  siguientes  ejercicios  utilizando  el  Teorema  de  la  Probabilidad  Total  y  el  Teorema  de 
Bayes. 

Una  persona  toma  al  azar  de  una  caja  uno  de  los  números  1,  2  ó  3,  y  luego  tira  un  dado 
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equilibrado  tantas  veces  como  indica  el  número  escogido.  Después  suma  el  resultado  de  las 
tiradas  del  dado.  ¿Cuál  es  la  probabilidad  de  que  obtenga  un  total  de  5? 

2  Una  compañía  utiliza  las  líneas  Ai,  Ai  y  A3  para  la  producción  de  un  microchip.  De  los 
microchip  fabricados  por  la  línea  A\ ,  el  5%  son  defectuosos;  de  los  fabricados  por  la  línea 
A2,  el  8%  son  defectuosos  y  el  10%  de  los  fabricados  por  A3  son  defectuosos.  El  50%  de 
todos  los  microchips  son  producidos  por  A±,  el  30  %  por  A2  y  el  restante  por  A3.  Se  selecciona 
un  microchip  al  azar. 

.  ¿Cuál  es  la  probabilidad  de  que  el  microchip  haya  sido  producido  por  A3  y  sea  defec¬ 
tuoso? 

b.  ¿Cuál  es  la  probabilidad  de  que  el  microchip  sea  defectuoso? 

c.  Si  se  observa  que  es  defectuoso,  ¿cuál  es  la  probabilidad  de  que  el  microchip  haya  sido 
producido  por  Ai? 
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CAPITULO  2 


Variables 


aleatorias  discretas 


Variables  aleatorias 


Al  realizar  un  experimento  aleatorio,  muchas  veces  no  estamos  interesados  en  el  resultado  sino 
en  una  función  del  mismo.  Por  ejemplo,  si  tiramos  dos  veces  un  dado  podemos  estar  interesados  en 
saber  cuál  es  la  suma  de  los  resultados  de  ambas  tiradas,  cuántas  veces  salió  un  valor  en  particular, 
cuál  es  el  máximo  de  los  dos  valores  observados,  etc. 

En  muchos  experimentos  aleatorios  el  espacio  í!  no  es  un  espacio  numérico,  entonces  nos  puede 
interesar  transformar  los  resultados  en  valores  numéricos. 

Podemos  lograr  ese  objetivo  definiendo  una  función  que  a  cada  elemento  del  espacio  muestral 
le  haga  corresponder  un  número. 

Definición: 

Una  variable  aleatoria  X  es  una  función  que  a  cada  elemento  w  del  espacio  muestral  f 1, 
le  hace  corresponder  un  número  real.  Es  decir,  X  :  íl  — >  R  si  ui  £  Í2,  X(oj)  £  R. 


Notación 

En  general  abreviaremos  variable  aleatoria  escribiendo  v.a. 
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Ejemplo  2.1 


Se  tira  un  dado  dos  veces  y  se  observa  X  =  “el  número  de  veces  que  sale  1” 


Ejemplo  2.2 


Se  tira  un  dado  dos  veces  y  se  observa  Y  =  “el  máximo  de  los  dos  valores” . 


Ejemplo  2.3 


Se  tira  una  moneda  hasta  que  sale  cara  y  se  define  Z  =  “el  número  de  tiradas  necesarias” . 


Ejemplo  2.4 


Se  administra  un  nuevo  tratamiento  a  tres  personas  que  padecen  una  enfermedad,  interesa  co¬ 
nocer  la  eficacia  de  ese  tratamiento  para  lograr  la  recuperación  en  una  semana  (esto  también 
puede  considerarse  un  experimento  aleatorio),  se  observa  V  =  “el  número  de  pacientes,  entre  los 
tres  tratados,  que  se  recupera  en  una  semana”. 


Ejemplo  2.5 


Se  elige  una  persona  al  azar  en  una  población  y  se  observa  W  =  “peso  de  la  persona  elegida” . 


Ejemplo  2.6 


Se  enciende  una  lámpara  y  se  observa  T  =  “el  tiempo  hasta  que  se  quema” . 

■ 

Todas  las  variables  definidas  en  los  ejemplos  anteriores  son  variables  aleatorias.  Ahora,  si  con¬ 
sideramos  el  conjunto  de  valores  que  puede  tomar  cada  una  de  ellas  vemos  que: 

«*  =  {0,1,2}  vv  =  {0,1,  2,  3} 

vY  =  {1,2,3,4,5,6}  «w  =  (0,oo) 

Vz  =  {1,2,3, ...}  vt  —  (0,  oo ) 

Los  conjuntos  de  valores  vx,  vy  y  «y  son  finitos,  vz  es  infinito  numerable  (ya  que  hay  un 
primer  elemento,  un  segundo  elemento,  etc.),  por  otra  parte  vt  y  vw  son  infinitos  no  numerables. 
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Definición: 


Cuando  el  conjunto  de  valores  (también  llamado  rango)  que  toma  una  v.a.  es  finito  o  infinito 
numerable,  la  variable  se  denomina  discreta. 


Notación 

Sea  aÉlyl  una  v.a.,  se  utilizará  la  notación  (X  =  a)  para  hacer  referencia  al  evento  de  Í2 
formado  por  todos  los  resultados  para  los  cuales  X  toma  el  valor  a,  y  ( X  <  a)  para  el  evento 
formado  por  todos  aquellos  resultados  para  los  que  X  toma  valores  menores  o  iguales  que  a. 
Esto  se  puede  escribir: 


(I  =  a)  =  (u  £  ü  tal  que  X{u)  =  a} 

(X  <  a)  =  {lo  £  fl  tal  que  X(ui)  <  a} 

De  la  misma  manera  se  utilizará  la  notación:  ( X  <  a),  (X  >  a)  y  ( X  >  a). 


Ejemplo  2.7 


Si  se  considera  el  Ejemplo  2.1,  el  espacio  muestral  es  fi  =  {(1, 1);  (1,  2); . . . ;  (1, 6);  (2, 1);  (2, 2); . . . ; 
(2,  6); ... ;  (6, 1);  (6,  2); ... ;  (6, 6)}  y  la  variable  X  definida  allí  es  “el  número  de  veces  que  sale  1” . 
Podemos  definir  los  eventos: 


(X  =  0)  =  {(2, 2);  (2,  3); . . . ;  (2, 6);  (3,  2);  (3,  3); . . . ;  (3, 6); . . . ;  (6,  2);  (6, 3); ... ;  (6,  6)} 

(X  =  1)  =  {(1, 2);  (1,  3);  (1,4);  (1,  5);  (1, 6);  (2, 1);  (3, 1);  (4, 1);  (5, 1);  (6, 1)} 

{X  =  2)  =  {(1, 1)} 

Si  suponemos  que  el  dado  es  equilibrado  y  el  espacio  muestral  es  equiprobable,  con  lo  cual  es 
fácil  ver  que: 


P(X  =  0)  =  25/36,  P(X  =  1)  =  10/36  y  P(X  =  2)  =  1/36 


Ejemplo  2.8 


Para  la  variable  Y  definida  en  el  Ejemplo  2.2,  el  espacio  muestral  Q  es  el  mismo  del 
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Ejemplo  2.7.  Luego  podemos  definir  los  eventos: 


(y  =  i)  =  {(i,i)} 

(F  =  2)  =  {(1,2);  (2,1);  (2, 2)} 

(Y  =  3)  =  {(1,3);  (3,1);  (2, 3);  (3, 2);  (3, 3)} 

(Y  =  4)  =  {(1,4);  (4, 1);  (2,4);  (4,2);  (3,4);  (4,3);  (4,4)} 

(X  =  5)  =  {(1,  5);  (5, 1);  (2, 5);  (5,  2);  (3, 5);  (5,  3);  (4,  5);  (5, 4);  (5,  5)} 

(Y  =  6)  =  {(1,  6);  (6, 1);  (2, 6);  (6,  2);  (3, 6);  (6,  3);  (4, 6);  (6, 4);  (5,  6);  (6, 5);  (6,  6)} 

Si  el  dado  es  equilibrado,  podemos  calcular  las  probabilidades  P(Y  =  y)  para  valores  de 
y  =  1,  2, 3, 4,  5,  6  como: 

P(Y  =  1)  =  1/36  P(Y  =  2)  =  3/36 

P(Y  =  4)  =  7/36  P(Y  =  5)  =  9/36 


Función  de  frecuencia  de  probabilidad 

Definición: 

Sea  X  una  v.a.  discreta  y  vx  su  conjunto  de  valores.  Se  define  la  función  de  frecuencia 
de  probabilidad  (o  simplemente  función  de  frecuencia)  de  X  como: 

f(x)  =  P(X  =  x )  para  todos  los  x  €  vx 

La  función  de  frecuencia  nos  permite  calcular  probabilidades  referidas  a  la  v.a.  X: 

P(X  €  A)  =  ^  f(x),  para  todo  4C1  (2.1) 

x£A 

x(=vx 

En  particular  si  A  =  [a,  b] : 

P(a<X<b)=  ^  f(x),  para  todo  a,  b  £  M  (2.2) 

a<x<b 

x£vx 


P{Y  =  3)  =  5/36 
P(Y  =  6)  =  11/36 


PROPIEDAD  2.1:  Sea  X  v.a.  discreta,  su  función  de  frecuencia  /  cumple: 

•  f(x)  >  0,  para  todo  x  £  vx 

•  J2  /(*)  =  L 

x£vx 
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EJERCICIO  2.1 

Demostrar  la  Propiedad  2.1. 

2  Sea  X  una  v.a.  discreta  con  vx  =  {—3, 1,  5,  8}.  ¿Cuáles  de  las  siguientes  funciones  corresponde 
a  una  función  de  frecuencia  de  A”?  Justifique. 

.  /( 1)  =  0.2,  /(— 3)  =  0.3,  /( 5)  =  0.5002,  /( 8)  =  -0.0002. 

.  /( 1)  =  1/8,  /(— 3)  =  1/2,  /( 5)  =  1/8  y  /( 8)  =  1/4. 

.  /( 1)  =  5/12,  /(— 3)  =  1/6,  /( 5)  =  1/4  y  /( 8)  =  3/4. 


Ejemplo  2.9 


A/(®) 


0.7  o 

25/36 


0.6  - 


0.5  - 

0.4  - 


0.3  - 

10/36- 


0.2  - 


0.1  - 


1/36 

0 


^  i 


La  función  de  frecuencia  de  la  v.a.  X  definida  en  el  Ejemplo  2.7,  está 
dada  por: 


X 

0 

1 

2 

f(x) 

25/36 

10/36 

1/36 

Se  puede  comprobar  fácilmente  que  verifica  la  Propiedad  2.1.  La  gráfi¬ 
ca  de  la  función  de  frecuencia  se  encuentra  a  la  izquierda  (por  con¬ 
vención  las  frecuencias  se  grafican  como  segmentos  verticales). 

A  partir  de  esta  función  se  pueden  determinar,  por  m,  todas  las 
probabilidades  que  uno  desee.  Por  ejemplo,  si  A  =  (0, 1.5) 

P(X  e  A)  =  P{ 0  <  A  <  1.5)  =  P( X  =  1)  =  /( 1)  =  H 


Ejemplo  2.10 


La  función  de  frecuencia  de  la  v.a.  Y  hallada  en  el  Ejemplo  2.8  se 
resume  en  la  siguiente  tabla: 


y 

i 

2 

3 

4 

5 

6 

f(y ) 

1/36 

3/36 

5/36 

7/36 

9/36 

11/36 

La  cual  también  verifica  la  Propiedad  2.1. 

Si  se  define  el  evento  A  =  “el  máximo  de  los  dos  valores  está  entre  3 
y  5  inclusive” ,  este  evento  puede  escribirse  como  A  =  (3  <  Y  <  5) 
y  su  probabilidad  se  calcula  como: 


A  f(v) 


11/36 

0.3  : 


9/36-  ■ 


0.2  : 
7/36 


5/36- 


0.1  - 

3/36 


1/36- 


y 
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(por  (¡2.2|)) 


5 

p(a)  =  p(3<y<5)=  J2  /fo)  =  £/fo) 

3<y<5  y= 3 

=  /( 3)  +  /( 4)  +  /( 5)  =  5/36  +  7/36  +  9/36  =  21/36. 


Función  de  distribución  o  función  de  distribución  acumulada 

Definición: 

La  función  de  distribución  o  función  de  distribución  acumulada  de  una  v.a.  X  se 
define  como: 

F(x)  =  P(X  <  x )  para  todo  iéI.  (2.3) 

Se  puede  comprobar  fácilmente  que  la  función  de  distribución  cumple: 

•  es  una  función  no  decreciente:  sia,fe€Rya<6  entonces  F(a)  <  F(b) 

•  toma  valores  entre  0  y  1 

Notación 

En  general  abreviaremos  función  de  distribución  acumulada  escribiendo  fda. 


PROPIEDAD  2.2:  Sea  F  la  fda  de  la  v.a.  X,  sean  a,  fe  €  1  tales  que  a  <  fe,  entonces  se 
cumple: 

P(a  <  X  <  6)  =  F(b)  -  F(a) 


I  Demostración  Como  a  <  b  entonces  podemos  escribir  (X  <  b)  =  (X  <  a)  U  (a  <  X  <  b)  y 
estos  dos  eventos  son  disjuntos  entonces  por  (A3),  la  Ley  aditiva: 

P{ X  <  fe)  =  P{X  <a)  +  P(a  <  X  <  fe), 

por  lo  tanto,  despejando  y  aplicando  (12.31).  obtenemos  que  P{a  <  X  <  fe)  =  F{b)  —  F(a). 
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Aclaración 


Notar  que  en  la  definición  anterior  y  en  la  Propiedad  2.2  no  estamos  aclarando  que  la  v.a.  X  sea 
una  v.a.  discreta.  Es  decir,  la  definición  y  esta  propiedad  son  válidas  tanto  para  v.a.  discretas 
como  para  continuas. 


Cuando  la  v.a.  X  es  discreta,  la  fda  se  calcula  como: 

F{x)  =P(X<  x)=  Y  /(fc)  (2-4) 

k  <x 
kevx 

Entonces,  la  función  de  distribución  de  una  v.a.  discreta  es  escalonada,  con  saltos  en  los  valores 
que  toma  la  variable  y  constante  en  el  resto.  Notar  que  la  magnitud  del  salto  es  igual  a  la  función 
de  frecuencia  en  este  valor  (ver  el  siguiente  ejemplo). 


Ejemplo  2.11 


Se  puede  calcular  la  fda  de  la  v.a.  X  del  Ejemplo  2.9,  utilizando  m,  de  la  siguiente  manera: 

•  Si  x  <  0,  F(x)  =  P(X  <  x)  =  f(k)  =  0  - - * - • — * 

k<.x 

oc;  n  x  i  o 

•  Si  0  <  X  <  1,  F(x)  =  P{X  <x)  =  Y  f(k)  =  /(°)  =  3g  - * — *-• - 

k<x 

QC;  Q  1  X  r, 

.  Si  1  <  a:  <  2,  F(x)  =  P(X  <  x)  =  ^  f{k)  =  /(O)  +  /(1)  =  —  • - • - a-— 

k<x 

•  Si  x  >  2,  F(x)  =  P(X  <  x)  =  Y  /(*)  =  /(0)  +  /(l)  +  /(2)  =  1  2 - i - 

k<.x 


Resumiendo,  la  función  de  distribución 
para  la  v.a  X  es: 


F(x)  =  < 


si 


si 


A  F(x) 


1.0 

35/36 


0.9 

0.8 


25/36 

x  <  0 

0.6 

<  X  < 

1 

0.5 

<  X  < 

2 

0.4 

x  >  2 

0.3 

0.2 

0.1 

•- 

-o 


X 

► 
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Ejemplo  2.12 


De  la  misma  manera  se  puede  calcular  la  fda  de  la  v.a.  Y  del  Ejemplo  2.10.  Resumiendo,  la 
función  de  distribución  para  la  v.a  F  es: 


F(y )  = 


0 

si 

y  <  i 

1/36 

si 

l<y<2 

4/36 

si 

2  <  y  <  3 

9/36 

si 

3  <  y  <  4 

16/36 

si 

4  <  y  <  5 

25/36 

si 

5  <  y  <  6 

1 

si 

y  >  6 

1.0  ■ 

0.9 
0.8  ■ 
0.7 

25/36 
0.6  ■ 

0.5  ■ 

16/36 

0.4  ■ 
0.3  ■ 

9/36 

0.2 


4/36 
0.1  ■ 


1/36 


Luego,  la  probabilidad  de  cualquier  evento  que  se  relacione  con  el  máximo  de  las  dos  tiradas 
puede  calcularse  usando  esta  función  de  distribución.  Por  ejemplo,  sean  los  eventos: 

A  =  “el  máximo  de  las  dos  tiradas  es  a  lo  sumo  3” , 

B  =  “el  máximo  de  las  dos  tiradas  es  4”  y 
C  =  “el  máximo  es  mayor  que  2  y  menor  que  5”. 

Entonces  sus  probabilidades  son: 


P{A)  =  P(Y  <  3)  =  F( 3)  =  9/36 

P(B)  =  P(Y  =  4)  =  P(Y  <  4)  -  P(Y  <  3)  =  F(4)  -  F(3)  =  7/36 
P(C)  =  P(2  <  Y  <  5)  =  P(2  <  Y  <  4)  =  F(4)  -  F( 2)  =  1/3 


EJERCICIO  2.2 

Calcular  para  cada  una  de  las  siguientes  v.a.  X  la  función  de  frecuencia  y  la  fda.  Graficar  ambas 
funciones. 

Supongamos  un  juego  donde  se  tira  un  dado  y  usted  gana  $12  si  en  el  dado  sale  6  y 
pierde  $3  si  sale  otro  número.  Sea  la  v.a.  X  =  “ganancia  en  este  juego”  y  vx  =  {—3, 12},  en 
donde  -3  refleja  que  se  han  perdido  $3,  lo  que  representa  una  ganancia  negativa. 

2  Cinco  pelotas  numeradas  del  1  al  5  se  colocan  en  una  urna.  Se  seleccionan  dos  de  ellas  al 
azar.  Sea  la  v.a.  X  =  “el  mayor  número  obtenido” . 

3.  Una  pieza  de  equipo  electrónico  contiene  6  chips  de  computadora,  dos  de  los  cuales  son 
defectuosos.  Al  azar  se  seleccionan  tres  chips,  se  retiran  del  equipo  y  se  inspeccionan.  Sea  la 
v.a.  A'  =  “el  número  de  chips  defectuosos  observados” . 
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Variables  aleatorias  independientes 


Tal  como  definimos  el  concepto  de  independencia  entre  dos  eventos  A  y  B,  definimos  la  inde¬ 
pendencia  de  v.a.  Lo  que  queremos  decir  intuitivamente  es  que  si  X  e  Y  son  v.a.  independientes, 
el  resultado  de  una  de  ellas  no  influye  en  el  resultado  de  la  otra. 

Definición: 

Las  v.a.  X,  Y  son  independientes  si  y  sólo  si  para  todo  a,  b  £  R,  los  eventos  (X  <  a)  e 
(Y  <  b)  son  independientes. 


Observación: 

En  particular,  para  v.a.  discretas,  se  puede  decir  que  X  e  Y  son  independientes 
si  y  sólo  si  para  todo  a,  b  €  R,  los  eventos  (X  =  a)  e  (Y  =  b)  son  independientes. 


Esta  noción  será  útil  para  representar  los  resultados  de  experimentos  que  no  se  influyen  mu¬ 
tuamente. 


Ejemplo  2.13 


Se  arrojan  dos  dados  equilibrados  a  la  vez,  uno  de  color  rojo  y  el  otro  verde.  Considerar  las  v.a.: 

A'  =  “el  número  del  dado  rojo”. 

Y  =  “el  número  del  dado  verde”. 

Z  =  “la  suma  de  los  dos  dados” . 

¿Las  v.a.  X  e  Y  son  independientes?  ¿Las  v.a.  X  y  Z  son  independientes? 

Primero  veamos  las  funciones  de  frecuencia  de  estas  tres  variables.  El  espacio  muestral  en  este 
caso  es:  íí  =  {(1, 1);  (1,  2); . . . ;  (1, 6);  (2, 1);  (2,  2); . . . ;  (2, 6); . . . ;  (6, 1);  (6,  2); . . . ;  (6, 6)},  donde  la 
primer  coordenada  es  el  resultado  del  dado  rojo  y  la  segunda  es  el  resultado  del  dado  verde. 
Luego  podemos  definir  los  eventos: 

(X  =  a)  =  {(a,  1);  (a,  2);  (a,  3);  (a,  4);  (a,  5);  (a,  6)},  para  todo  a  £  {1,  2, . . . ,  6} 

(Y  =  b)  =  {(1,  6);  (2,  b);  (3, 6);  (4,  6);  (5,  b)\ (6,  b)},  para  todo  b  €  {1,  2, . . . ,  6} 

(Z  =  2)  =  {(1,1)} 
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(Z  =  3)  =  {(1,2);  (2,1)} 

{Z  =  4)  ={(1,3);  (2, 2);  (3,1)} 


(Z  =  10)  ={(4,6);  (5, 5);  (6, 4)} 

(Z=  11)  ={(5,6);  (6, 5)} 

(Z  =  12)  ={(6,6)} 

Es  claro  que  fx{a)  =  P(X  =  a)  =  6/36  =  1/6  para  todo  a  £  {1,2,..., 6}, 
fy{b)  =  P(Y  =  b)  =  6/36  =  1/6  para  todo  b  £  { 1, 2, . . . ,  6}  y 


z 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

fz(z) 

1/36 

2/36 

3/36 

4/36 

5/36 

6/36 

5/36 

4/36 

3/36 

2/36 

1/36 

Para  todo  a,  b  £  {1,2,...,  6},  P((X  =  a)  (1  (Y  =  b ))  =  1/36  y 

P(X  =  a)  x  P(Y  =  b)  =  1/6  x  1/6  =  1/36,  es  decir,  (X  =  a)  e  (Y  =  b)  son  independien¬ 
tes.  Por  lo  tanto,  las  v.a.  X  e  Y  son  v.a.  independientes. 

Por  otro  lado,  P({X  =  1)  fl  (Z  =  2))  =  P({(1,1)})  =  1/36  y 

P(X  =  1)  x  P{Z  =  2)  =  1/6  x  1/36  =  1/216  ^  1/36,  es  decir,  (X  =  1)  y  (Z  =  2)  no  son 
independientes.  Por  lo  tanto,  las  v.a.  X  y  Z  no  son  v.a.  independientes. 


Valor  esperado  o  media 


El  valor  esperado  de  una  variable  aleatoria  (llamado  también  esperanza  matemática,  valor 
medio,  o  media)  es  el  promedio  pesado  de  los  valores  que  toma,  en  donde  cada  valor  recibe  un 
peso  igual  a  su  probabilidad.  La  media  es  una  medida  de  centralidad,  es  decir,  nos  da  un  centro 
alrededor  del  cual  se  distribuyen  los  valores  de  la  v.a. 

Definición: 

Sea  X  una  v.a.  discreta  con  valores  en  el  conjunto  Vx  y  función  de  probabilidad  /,  se  define 
el  valor  esperado  de  X  como: 

E(X)  =  */(*).  (2-5) 

xEvx 

si  se  cumple  que  |a;|/(:r)  <  oo.  Si  esta  suma  diverge  se  dice  E{X)  no  existe. 
x£vx 

El  significado  intuitivo  del  valor  esperado  es  el  siguiente:  imaginemos  que  el  experimento  se 
repite  un  gran  número  N  de  veces,  y  se  toma  el  promedio  de  los  valores  de  X  observados  en  cada 
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repetición,  entonces  E{X)  es  el  límite  de  esos  promedios  cuando  N  tiende  a  infinito. 


Ejemplo  2.14 


Volvamos  al  juego  del  Ejercicio  2.2  en  el  que  se  tira  un  dado  y  usted  gana  $12  si  en  el  dado  sale 
6  y  pierde  $3  si  sale  otro  número.  ¿Jugaría  usted  a  este  juego?  ¿Esperaría  ganar? 

Veamos:  primero  definamos  la  v.a.  X  =  “ganancia  en  este  juego”,  donde  vx  =  {“3, 12}. 
Ahora,  la  función  de  probabilidad  de  esta  v.a.,  que  se  obtuvo  en  el  ejercicio,  es: 


X 

-3 

12 

f(x) 

5/6 

1/6 

Como  en  este  caso  Vx  es  finito,  sabemos  que  existe  la  esperanza  y  la  podemos  calcular  como: 
E{X)  =  -3  x  5/6  +  12  x  1/6  =  -3/6  =  -0.5 

Luego,  el  valor  que  uno  espera  ganar  es  -0.5.  Esto  significa  que  si  usted  jugara  muchas  veces  a 
este  juego,  algunas  veces  ganaría,  otras  perdería,  pero  el  promedio  final  es  negativo,  a  la  larga 
no  espere  ganar!!! 


Valor  esperado  o  media  de  una  función  de  una  v.a. 


Si  queremos  calcular  por  definición  la  esperanza  de  una  v.a.  V,  que  es  función  de  una  v.a. 
discreta  X,  deberíamos  calcular  su  función  de  frecuencia.  Pero  si  se  conoce  de  antemano  la  función 
de  frecuencia  de  X,  la  siguiente  proposición  nos  permite  calcular  la  media  de  Y  de  una  manera 
más  sencilla. 


PROPOSICIÓN  2.1:  Sea  X  una  v.a.  discreta  con  valores  en  el  conjunto  Vx  y  función 
de  frecuencia  /  y  h  :  R  — >  K  una  función  cualquiera,  entonces  Y  =  h(X)  es  una  v.a.  cuya 
media  se  calcula  como: 

E(Y)  =  E(h(X))  =  h(x)f(x)  (2.6) 

x£vx 

si  se  cumple  que  ^  \h(x)\f(x)  <  oo.  Si  esta  suma  diverge  se  dice  E(Y)  no  existe. 

XEVX 


Aceptamos  este  resultado  sin  demostración. 

Una  consecuencia  inmediata  de  la  proposición  anterior,  es  que  el  valor  medio  tiene  la  siguiente 
propiedad: 
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PROPIEDAD  DE  LINEALIDAD  DE  LA  ESPERANZA:  Sea  X  una  v  a.  con  media 
E(X)  y  sean  ay  b  números  reales,  entonces 

E{aX  +  b)  =  aE{X)  +  b.  (2.7) 


I  Demostración  Si  X  es  discreta  con  valores  en  el  conjunto  Vx  y  función  de  probabilidad  /,  la 
demostración  de  esta  propiedad  es  simple,  utilizando  la  Proposición  anterior  con  h( X)  =  aX  +  6, 
tenemos  que: 

E{aX  +  b)  =  ^2  ( ax  +  b)f(x) 

xEvx 

=  '^2  ( axf(x )  +  bf(x ))  (distributiva  en  el  sumando) 

x£vx 

1=  a  ^ 2  xf(x )  +  b  ^2  f(x)  (distributiva  y  factor  común  en  la  sumatoria) 

XGVx  x£vx 

=  aE{X)  +  b  (por  (12.51)  y  por  la  Propiedad  2.l). 


EJERCICIO  2.3 

Sea  X  una  v.a.  discreta  con  función  de  frecuencia  de  X: 


X 

0 

1 

2 

3 

4 

/(*) 

0.08 

0.15 

0.45 

0.27 

0.05 

Calcular  la  E(y/X). 

2  Calcular  la  E(-2y/X  +  3.5). 


Varianza  y  desviación  típica 


Ya  definimos  que  la  media  es  una  medida  de  centralidad.  Ahora,  vamos  a  definir  un  parámetro 
que  nos  da  una  idea  de  la  dispersión  de  los  valores  de  X  alrededor  de  su  valor  medio. 

Definición: 


Sea  X  una  v.a.  que  tiene  media  E(X),  se  define  la  varianza  de  X  como: 


var(X)  =  E  (X  —  E(X))  (2.8) 

cuando  dicha  esperanza  existe.  Y  se  define  la  desviación  típica  (o  estándar)  como: 

dt{X)  =  \Jvar(X)  (2.9) 
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La  var(X)  (o  P(X))  se  expresa  en  las  unidades  de  X  al  cuadrado,  pero  dt(X)  se  expresa  en 
las  mismas  unidades  que  X. 

La  siguiente  propiedad  nos  permite  una  forma  práctica  de  calcular  la  varianza. 


PROPIEDAD  2.3:  La  definición  de  var(X)  es  equivalente  a: 

var(X)  =  E{X2)  -  (E(X))2 


I  Demostración  Sea  X  una  v.a.  discreta  con  valores  en  el  conjunto  vx,  función  de  probabilidad 
/  y  llamamos  E{X)  =  /í: 


var(X)  =  E[(X-  /i)2]  =  E(X2  -  2Á>  +  ¿i2) 

=  ~  2x/j,  + n2)f(x) 

x£vx 

=  Y  ^/(x)-2^  y  xf(x)+n2  y  f(x) 

X(zVx  x£Vx  XdzVx 

=  E{X2)  -  2 1?  +  fjL2 
=  E(X2)  -  \i2 


(desarrollo  del  cuadrado) 
(por  (1M 

(distributiva  y  factor  común) 

(por  (12.51).  (12.61)  y  Propiedad  2.1) 


PROPIEDAD  2.4:  Sea  X  una  v.a.  y  sean  a  y  b  números  reales.  Entonces: 

var{aX  +  b)  =  a2var(X )  (2-10) 

dt(aX  +  b)  =  |a|  dt(X) 


Demostración  Por  la  definición  dada  en  (12.81).  tenemos  que: 

var{aX  +  b)  =  E  ((aX  +  b)  —  E(aX  +  b)Y 

Luego, 


E 


((aX  +  b)-E(aX  +  b)Y 


=  E 
=  E 
=  E 


(aX  +  A  -  aE{X)  -  #)2 
(a(X-E(X))) 
a2(X-E{X))2 


=  azE 


(- X-E(X)Y 


=  a  var 


(X) 


(por  (EZD) 
(factor  común) 

(*) 

(por  (Í2781)) 


En  (*)  observar  que  si  Y  =  (X  —  E(Á'))“  es  una  v.a.  y  por  m  tenemos  que  E(a2Y)  =  a2E{Y). 
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Por  último: 


dt(aX  +  b)  =  \J  var(aX  +  b ) 
=  \/a2var(X) 

=  Va var(X) 
=  |a|  dt(X) 


(por  (ÜHfl)) 
(por  (E3ÜD) 
(distributiva  de  la  raíz) 
(por  (|279l)) 


Ejemplo  2.15 


Aún  cuando  ambas  distribuciones  ilustradas  tienen  la  misma  media  ( E(X )  =  E(Y)  =  3),  la 
distribución  de  la  v.a.  Y  tiene  mayor  dispersión  o  variabilidad  que  la  v.a.  X.  Calcule  las  varianzas 
en  ambos  casos  y  compare. 


Algunas  variables  aleatorias  discretas 


Se  pueden  hallar  ejemplos  de  v.a.  discretas  en  numerosas  aplicaciones  cotidianas  y  en  casi 
todas  las  disciplinas.  No  obstante,  hay  dos  distribuciones  de  probabilidad  discretas  que  sirven  para 
modelizar  un  gran  número  de  estas  aplicaciones,  la  distribución  de  probabilidad  binomial  y  la 
distribución  de  Poisson,  las  cuales  estudiaremos  en  esta  sección. 
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Distribución  binomial 


Definición: 

Un  experimento  binomial  es  el  que  cumple  las  siguientes  condiciones: 

1.  El  experimento  consiste  en  n  repeticiones  idénticas  de  un  ensayo  que  toma  dos  resul¬ 
tados  posibles,  que  se  denotan  éxito  (E)  y  fracaso  (F). 

2.  Las  repeticiones  son  independientes,  lo  que  significa  que  el  resultado  de  cualquier 
repetición  particular  no  influye  en  el  resultado  de  ninguna  otra. 

3.  La  probabilidad  de  éxito  es  constante  en  cada  repetición  del  ensayo,  esta  probabilidad 
se  denota  con  P{E)  =  p.  Se  deduce  así,  que  la  probabilidad  de  fracaso  será  igual  a 
P(F)  =  1  -p. 


Con  este  tipo  de  experimentos  se  asocia  la  v.a.  binomial. 


Ejemplo  2.16 


Supongamos  que  en  un  hospital  hay  3  pacientes  internados  con  determinada  enfermedad,  a  los 
cuales  se  les  aplica  el  mismo  tratamiento  (estos  individuos  no  son  parientes).  Supongamos  que 
la  probabilidad  de  que  un  individuo  se  recupere  en  una  semana  de  tratamiento  es  0.8  (p  =  0.8). 
Sea  Y  la  variable  aleatoria  que  cuenta  el  número  de  individuos  que  se  recuperan  en  una  semana 
de  tratamiento  entre  los  3.  Los  posibles  resultados  y  sus  respectivas  probabilidades  se  resumen 
en  la  siguiente  tabla,  donde  S  y  N  indican  que  el  individuo  se  recupera  y  no  se  recupera: 


íí:  resultados  posibles  de  la 

Probabilidad  del  resultado  obtenido 

Valores 

evolución  de  3  pacientes 

(Se  utiliza  independencia) 

de  Y 

(S,  S,  S) 

0.8  x  0.8  x  0.8  =  0.83  =  0.83  x  (1  -  0.8)° 

3 

(S,  N,  N) 

(N 

oo 

o 

1 

7— 1 

X 

oo 

o 

II 

OO' 

O 

1 

X 

oo' 

O 

1 

X 

00 

o 

1 

(N,  S,  N) 

(1  -  0.8)  x  0.8  x  (1  -  0.8)  =  0.81  x  (1  -  0.8)2 

1 

(N,  N,  S) 

(N 

OO 

o 

1 

7—1 

X 

00 

o 

II 

oo 

o 

X 

oo' 

o 

1 

X 

oo' 

o 

1 

1 

(S,  S,  N) 

0.8  x  0.8  x  (1  -  0.8)  =  0.82  x  (1  -  0.8)1 

2 

(S,  N,  S) 

0.8  x  (1  -  0.8)  x  0.8  =  0.82  x  (1  -  0.8)1 

2 

(N,  S,  S) 

(1  -  0.8)  x  0.8  x  0.8  =  0.82  x  (1  -  0.8)1 

2 

(N,  N,  N) 

CO 

oo' 

O 

1 

7— 1 

X 

o 

oo 

o 

II 

oo' 

O 

1 

X 

oo' 

O 

1 

X 

oo' 

O 

1 

0 

Si  nos  interesa  únicamente  saber  cuántos  pacientes  se  recuperan  en  la  primera  semana  de 
tratamiento  (el  valor  de  Y),  y  las  respectivas  probabilidades,  se  puede  resumir  aún  más: 
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Valor  de  Y 

Probabilidad 

0 

1  x  0.8°  x  (1  -  0.8)3 

1 

3  x  0.81  x  (1  -0.8)2 

2 

3  x  0.82  x  (1  -0.8)1 

3 

1  x  0.83  x  (1  -  0.8)° 

Veamos  con  detalle  cómo  se  llegó  a  estos  resultados  tomando  uno  de  los  casos  como  ejemplo: 

/( 1)  =  P(Y  =  1)  =  P{(S,  N ,  N),  (N,  S,  N),  (N ,  N ,  5)} 

=  P{{S ,  N,  N)}  +  P{(N,  S,  N)}  +  P{(N,  N,  S)}  (por  ser  disjuntos) 

=  0.81  x  (1  —  0.8)2  +  0.81  x  (1  —  0.8)2  +  0.81  x  (1  -  0.8)2  =  3  x  0.81  x  (1  -  0.8)2 

Generalizando,  la  función  de  frecuencia  de  la  v.a.  Y  es  la  que  se  muestra  en  el  siguiente 
cuadro: 


Valor  de  Y 

Probabilidad 

0 

1  x  0.8°  x  (1  -  0.8)3  =  Q  j  x  0.8°  x  (1  -  0.8)3-0 

1 

3  x  0.81  x  (1  -  0.8)2  =  (^j  x  0.81  x  (1  -  0.8)3-1 

2 

3  x  0.82  x  (1  -  0.8)1  =  Q  j  x  0.82  x  (1  -  0.8)3"2 

3 

1  x  0.83  x  (1  -  0.8)°  =  x  0.83  x  (1  -  0.8)3-3 

Definición: 

El  número  total  de  éxitos  observados  entre  los  n  ensayos  de  un  experimento  binomial,  es 
una  variable  aleatoria  binomial  con  parámetros  n  y  p. 

Los  valores  que  puede  tomar  esta  variable  son:  vx  =  {0, 1, 2, ,  n}. 

La  función  de  frecuencia  de  X  es: 

m  =  P{ X  =  k)  =  Q  pk(l-p)n-k,  k  G  vx  (2.11) 

donde  O  =  Mfrht- 


Notación 

Si  X  es  una  v.a.  binomial  con  parámetros  n  y  p,  lo  denotaremos  como  X  ~  B(n,p). 

Para  demostrar  que  la  expresión  (12.111)  representa  una  función  de  frecuencia  legítima  se  debe 
verificar  la  Propiedad  2.1,  es  decir: 
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•  f(k)  =  (?)  pfe(  1  —  p)n  k  >  O,  para  todo  k  E  vx 


¿/(*o  =  ¿  Qp*(i-p) 

/c— 0  fc=0 


1  (en  este  caso  se  usa  el  Teorema  del  binomio  de  Newton). 


Ejemplo  2.17 


Se  arroja  cinco  veces  una  moneda  equilibrada.  Se  desea  calcular  la  función  de  frecuencia  y  de 
distribución  del  número  de  caras  en  las  cinco  tiradas. 

Definimos  la  v.a.  X=  “número  de  caras  en  las  5  tiradas”.  Como  X  ~  B( 5,0.5)  entonces 
vx  =  {0, 1,  2,  3, 4, 5}.  Luego  las  gráficas  de  /  y  F  son: 


0.3125 

0.3 


A /O) 


0.2 


0.1 


0.03130 


X 

> 


PROPOSICIÓN  2.2:  Si  A'  ~  B(n,p ),  entonces: 

•  E(A)  =  np 

•  P(X)  =  np(l  —  p) 

•  dí(A)  =  ^/np(l  -p) 


Esta  proposición  se  puede  demostrar  utilizando  la  definición  de  esperanza  y  varianza  para  una 
v.a.  discreta,  y  recordando  además,  el  Teorema  del  binomio  de  Newton. 
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Ejemplo  2.18 


Para  la  v.a.  X  del  Ejemplo  2.17,  se  tiene  que  E(X)  =  5x  0.5  =  2.5,  V(X)  =  5x  0.5  x  (1  —  0.5)  =  1.25 
y  dt{ X)  =  V/E25  =  1.1180. 

Para  la  v.a.  Y  ~  5(3, 0.8),  del  Ejemplo  2.16,  tenemos  que  E[Y)  =  3  x  0.8  =  2.4, 
V(Y)  =  3  x  0.8  x  (1  -  0.8)  =  0.48  y  dt(Y)  =  ^048  =  0.6928. 


EJERCICIO  2.4 

De  una  urna  que  contiene  una  bola  blanca  y  nueve  bolas  negras,  se  hacen  cinco  extracciones  suce¬ 
sivas  con  reemplazo.  Llamamos  X  al  número  de  bolas  blancas  obtenidas  en  las  cinco  extracciones. 

1  Indicar  la  distribución  de  probabilidad  de  X ,  su  rango  y  cuales  son  sus  parámetros. 

2.  ¿Cuál  es  la  probabilidad  de  que  se  saquen  exactamente  dos  bolas  blancas? 

3,  ¿Cuál  es  la  probabilidad  de  obtener  al  menos  dos  bolas  blancas? 

¿Cuál  es  la  probabilidad  de  que  se  saque  no  más  de  tres  bolas  blancas? 


Definición: 

Si  n  =  1,  o  sea  X  ~  5(1,  p),  la  v.a.  X  toma  sólo  los  valores:  1  con  probabilidad  p  y  0  con 
probabilidad  1  —  p.  En  este  caso  se  dice  que  X  tiene  distribución  de  Bernoulli. 

Resumimos  en  una  tabla  la  función  de  frecuencia  de  X: 


X 

0 

i 

/(*) 

i -p 

p 

Observación: 

En  general,  cuando  se  realizan  extracciones  con  reposición,  como  en  el  Ejercicio 
2.4,  estamos  en  presencia  de  un  experimento  binomial. 

Por  el  contrario,  si  las  extracciones  son  sin  reposición,  el  resultado  de  cada  ex¬ 
tracción  depende  de  las  anteriores,  de  modo  que  no  vale  la  hipótesis  de  indepen¬ 
dencia  y  por  ende  no  es  un  experimento  binomial.  Sin  embargo,  si  la  población 
es  grande  y  la  muestra  extraída  no  supera  el  5%  del  tamaño  de  la  población, 
cada  extracción  puede  considerarse  “prácticamente”  independiente  de  las  ante¬ 
riores  y  es  posible  analizar  el  experimento  como  binomial.  En  consecuencia,  la 
v.a.  número  de  éxitos  en  esas  extracciones  puede  pensarse  como  binomial. 
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EJERCICIO  2.5 


En  cada  caso,  indicar  si  el  experimento  puede  ser  considerado  binomial  recordando  las  condiciones 
que  deberían  cumplirse  y  justificando  correctamente. 

Se  tiene  una  urna  con  15  bolillas  blancas  y  5  verdes.  Se  extraen  al  azar  y  con  reemplazo  3 
bolillas  y  se  observa  si  son  blancas. 

2.  Se  tiene  una  urna  con  15  bolillas  blancas  y  5  verdes.  Se  extraen  al  azar  y  sin  reemplazo  3 
bolillas  y  se  observa  si  son  blancas. 

3.  Se  realizan  tres  extracciones  sin  reemplazo  de  una  urna  que  contiene  1500  bolillas  blancas  y 
500  verdes,  interesa  observar  si  se  seleccionaron  bolillas  blancas. 


Distribución  de  Poisson 

Definición: 

Se  dice  que  una  v.a.  X  tiene  distribución  de  Poisson  con  parámetro  A  (A  >  0)  si  su 
función  de  frecuencia  es: 

Xx 

/(x)=e-A^j-  para  x  =  0, 1,  2, . . .  (2-12) 

Notación 

Si  la  v.a.  X  tiene  distribución  de  Poisson  con  parámetro  A,  lo  denotaremos  como:  X  ~  P( A). 

La  distribución  de  Poisson  sirve  para  modelizar  el  número  X  de  eventos  que  ocurren  aleatoria¬ 
mente  en  el  tiempo  o  en  una  región.  A  continuación  veamos  algunos  ejemplos  de  experimentos  en 
los  cuales  la  variable  aleatoria  puede  ser  modelizada  con  distribución  de  Poisson: 

•  El  número  de  llamadas  recibidas  por  un  conmutador  durante  un  tiempo  determinado. 

•  El  número  de  bacterias  por  volumen  de  fluido. 

•  El  número  de  llegadas  de  clientes  al  mostrador  de  una  caja  de  pago  en  un  tiempo  determinado. 

•  El  número  de  descomposturas  de  una  máquina  durante  cierto  día. 

•  El  número  de  accidentes  de  tránsito  en  un  cruce  dado  durante  un  tiempo  establecido. 

•  El  número  de  árboles  de  determinada  especie  distribuidos  aleatoriamente  en  un  área. 

Algunos  de  estos  ejemplos  son  procesos  temporales,  interesa  conocer  cuántas  veces  ocurre  un 
evento  en  un  intervalo  de  tiempo,  y  otros  son  procesos  espaciales,  interesa  conocer  cuántos  “puntos” 
hay  en  un  volumen  o  un  área. 
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Definición: 


Se  denomina  proceso  temporal  de  Poisson  cuando  cumple  con  las  siguientes  característi¬ 
cas: 

•  Invariancia:  las  condiciones  no  cambian  en  el  tiempo. 

Falta  de  memoria:  lo  que  sucede  en  el  intervalo  de  tiempo  [0,  í)  no  influye  en  lo  que 
suceda  en  el  intervalo  [s,  r)  para  r  >  s  >  t. 

Sucesos  aislados:  la  probabilidad  de  que  en  un  intervalo  de  tiempo  muy  corto  ocurra 
más  de  una  vez  el  evento,  es  despreciable  comparada  con  la  probabilidad  de  que  ocurra 
una  vez  o  ninguna. 

Para  un  proceso  de  este  tipo,  si  Xt  es  la  v.a.  que  mide  el  número  de  veces  que  ocurre  el  evento 
en  un  intervalo  de  tiempo  de  longitud  i,  puede  verse  que  Xt  es  una  variable  aleatoria  discreta  cuya 
función  de  frecuencia  está  dada  por: 

f(x)  =  e~cxt  ^ C  X  ^  para  x  =  0, 1, 2, . . . 

Comparando  con  la  expresión  (12.1211 ,  se  puede  ver  que  X t  tiene  distribución  de  Poisson  con  paráme¬ 
tro  A t  =  c  x  t,  donde  c  es  una  constante  positiva  que  indica  la  cantidad  de  veces  que  ocurre  el 
evento  de  interés  por  unidad  de  tiempo,  c  se  llama  tasa  de  ocurrencia  del  proceso. 


Ejemplo  2.19 


Llegan  clientes  a  un  mostrador  de  un  negocio  con  una  distribución  de  Poisson  a  una  tasa  de  5 
por  hora.  Si  queremos  saber  cuál  es  la  probabilidad  de  que  no  lleguen  más  de  tres  clientes  en 
una  hora,  definimos  la  v.a.  X\  =  “cantidad  de  clientes  que  llegan  al  mostrador  en  una  hora”. 
Entonces  X\  ~  P{ Ai),  pues  Ai  =  5  x  1.  Así,  la  probabilidad  pedida  es: 

P(X i  <  3)  =  F(3)  =  0.2650  (por  Tabla) 

Sin  embargo,  si  queremos  calcular  la  probabilidad  de  que  lleguen  al  menos  6  clientes  en  dos  horas, 
no  podemos  utilizar  la  v.a.  X\  antes  definida,  tendremos  que  redefinirla,  ya  que  el  intervalo  de 
tiempo  ahora  es  de  2  hs.  Luego,  A2  =  “cantidad  de  clientes  que  llegan  al  mostrador  en  dos  horas” , 
X2  ~  P( A2),  ya  que  A2  =  5  x  2  =  10.  El  cálculo  de  la  probabilidad  pedida  es: 

P(X 2  >  6)  =  1  -  P(X2  <  6)  =  1  -  P(X2  <  5)  =  1  -  F( 5)  =  1  -  0.0671  =  0.9329  (por  Tabla) 

Por  último,  si  queremos  calcular  la  probabilidad  de  que  lleguen  exactamente  5  clientes  en  media 
hora,  Xi/2  =“cantidad  de  clientes  que  llegan  al  mostrador  en  media  hora”,  X\j2  ~  P(2.5)  y 

P{X  i/2  =  5)  =  e"2-5^  =  0.0668 
5! 

Las  gráficas  de  la  función  de  frecuencia  para  las  v.a.  Ai,  X1/2  y  X2  son,  respectivamente: 
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A/fiO 


Definición: 

Se  denomina  proceso  espacial  de  Poisson  cuando  cumple  con  las  siguientes 
características: 

Homogeneidad  espacial:  la  probabilidad  de  que  un  punto  este  en  una  región  dada, 
sólo  depende  del  tamaño  de  esa  región  (área  o  volumen)  y  no  de  su  forma  o  posición. 

•  No  interacción:  lo  que  ocurre  en  una  región  es  independiente  de  lo  que  ocurre  en 
otra,  si  no  se  superponen. 

La  v.a.  Xa  que  mide  el  número  de  “puntos”  en  una  región  de  área  o  volumen  a,  tiene  distribución 
de  Poisson  con  parámetro  Xa  =  ex  a,  donde  c  se  interpreta  como  la  tasa  de  ocurrencia  del  proceso. 


Ejemplo  2.20 


La  distribución  de  plantas  de  cierta  especie  en  una  zona  sigue  un  proceso  de  Poisson  con  una 
tasa  de  5  plantas  por  metro  cuadrado.  Si  deseamos  calcular  la  probabilidad  de  no  hallar  plantas 
en  un  área  cuadrada  de  1  metro  de  lado,  definimos  la  v.a.  X-y  =  “número  de  plantas  en  una 
región  cuadrada  de  área  1  m2”,  donde  Xy  ~  P(Ai)  con  Ai  =  5  x  1.  Es  decir,  Xy  ~  P( 5)  y  la 
probabilidad  pedida  es  P(X1  =  0)  =  e-5  x  ^  =  0.0067. 

Ahora,  ¿de  qué  medida  debe  ser  tomado  el  radio  r  de  una  región  circular  de  muestreo  para  que 
la  probabilidad  de  hallar  al  menos  una  planta  de  esa  especie  sea  por  lo  menos  0.99?  Necesitamos 
definir  otra  v.a.  Xa  =  “número  de  plantas  en  una  región  circular  de  área  am2”,  donde  Xa  ~ 
P(Aa)  y  A a  =  ex  a,  entonces  el  planteo  es 

P(Xa  >  0)  >  0.99  (2.13) 

Si  la  región  de  muestreo  es  circular  de  radio  r,  el  área  de  esa  región  es  a  =  n  x  r2,  y  la  v.a. 


47 


Xa  que  mide  el  número  de  plantas  en  esa  región  tendrá  distribución  de  Poisson  con  parámetro 
A„  =  c  x  a  =  5  x  (ir  x  r 2),  entonces, 


P(Xa  >  0)  =  1  -  P(Xa  <  0)  =  1  -  P(Xa  =  0) 


_  _  ^  —  5X7 rxr2 

Luego,  si  reemplazamos  en  (12.131).  obtenemos: 


1  —  e— 5X7T 

Xr2 

> 

0.99 

0.01  -  e_5X7t 

Xr2 

> 

0 

0.01 

> 

p  — 5  X7TXr2 

ln(0 

01) 

> 

\n(e~5x7rxr 

ln(0 

01) 

> 

—5  x  ir  x  r 

ln(0. 

01) 

< 

r 2 

—  5  X  7T 

—  ln(0.01) 

1/2 

< 

r 

5  x  ir 

0.5415 

< 

r 

(5  x  7T  x  r2)0  _  1  „_5xwxr.2 

0!  _ 

(restando  de  ambos  lados  0.99) 
(sumando  de  ambos  lados  e_5x7rxr'  ) 
(aplicando  de  ambos  lados  la  función  ln) 
(por  propiedad  de  función  inversa) 
(dividiendo  en  ambos  lados  por  —  5  x  ir) 

(aplicando  en  ambos  lados  raíz  cuadrada) 


Por  lo  tanto,  el  radio  de  la  región  circular  de  muestreo  debe  ser  de  al  menos  0.5415  metros  para 
poder  hallar  allí  una  planta  o  más,  con  probabilidad  mayor  o  igual  a  0.99. 


EJERCICIO  2.6 

Se  está  registrando  la  emisión  de  partículas  radiactivas  y  se  supone  que  es  un  proceso  de  Poisson 
con  tasa  6  por  minuto. 

¿Cuál  es  la  probabilidad  de  que  no  haya  registro  de  emisión  de  partículas  en  un  período  de 
1  minuto? 

2,  ¿Cuál  es  la  probabilidad  de  que  en  un  período  de  30  segundos  ocurran  al  menos  dos  emisiones? 

3.  Si  no  hubo  registro  de  emisión  entre  las  9:10  AM  y  las  9:12  AM,  ¿cuál  es  la  probabilidad  de 
que  ocurra  una  emisión  entre  las  10:10  AM  y  las  10:12  AM? 

¿Cuál  es  el  período  de  tiempo  para  que  la  probabilidad  que  haya  al  menos  una  emisión  sea 
mayor  a  0.95? 
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PROPOSICIÓN  2.3:  Si  X  tiene  una  distribución  de  Poisson  con  parámetro  A,  X  ~  P( A), 
entonces: 

•  E(X)  =  A 

•  V(X)  =  A 

•  dt(X)  = 


Estos  resultados  también  se  pueden  obtener  de  manera  directa  de  las  definiciones  de  media  y 
varianza  de  una  v.a.  discreta. 


Ejemplo  2.21 


En  base  al  Ejemplo  2.19,  tenemos  las  siguientes  v.a.  X\  r 

entonces: 

-  P(5),  X2 

-  P(10)  y  X1/2 

E(Xi)  =  V(-Xi)  =  5 

dt{X  i) 

=  2.2361 

E{X2)  =  V{X2)  =  10 

dt(X2) 

=  3.1623 

E(X1/2)  =  V(X1/2)  =  2.5 

dt(X  1/2) 

=  1.5811 

Aproximación  de  Poisson  a  la  binomial 

Si  X  ~  B(n,p),  se  puede  demostrar  que  cuando  n  es  grande  y  p  pequeño,  vale  la  siguiente 
aproximación: 

f{k)  =  P(X  =  k)=  pk{l  -p)n~k  =  e~x  k  G  vx  y  A  =  np 

Es  decir,  X  «  P(np).  La  notación  «  significa  que  tiene  aproximadamente  esa  distribución. 

Esta  aproximación  es  aceptable  si  p  <  0.05  y  n  >  20. 


Ejemplo  2.22 


Se  sabe  que  un  peso  muy  bajo  en  el  nacimiento,  menor  a  1500  gr,  es  una  de  las  causas  de 
mortalidad  infantil.  Se  conoce  que  en  determinada  población,  el  porcentaje  de  niños  con  muy 
bajo  peso  al  momento  de  nacer  es  de  1,2%.  Si  consideramos  200  nacimientos  en  un  hospital  de 
esa  población,  ¿cuál  es  la  probabilidad  de  que  el  número  de  recién  nacidos  con  muy  bajo  peso 
en  ese  grupo  sea  mayor  a  3? 

Sea  la  v.a.  X  =  “número  de  niños  con  muy  bajo  peso  entre  los  200  nacimientos  de  un  hospital” , 
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X  ~  5(200,0.012)  entonces: 


/200\ 

P(X  >  3)  =  1  -  P(X  <  3)  =  1  -  V  0.012fc(l  -  0.012)2OO_fe  =  1  -  0.7795  =  0.2205 

fe=o  '  k  ' 

Como  p  =  0.012  <  0.05  y  n  >  20,  se  puede  usar  la  aproximación  de  Poisson  a  la  binomial  y 
así  facilitar  las  cuentas.  Por  lo  tanto: 


X  «  P(200  x  0.012)  <=>  X  «  P(2.4) 


Entonces: 


P(X  >  3) 


1  -  P(X  <  3)  ^  1  -  e"2'4 


2.41 

IT 


2.42  2.43" 

~2T  +  ~3T 


1  -  0.7787  =  0.2213 


La  siguiente  tabla  muestra  que  tan  buena  es  la  aproximación  de  sus  frecuencias: 


fe 

5(200,0.012) 

P(2.4) 

0 

0.0894105 

0.0907179 

1 

0.2171917 

0.2177231 

2 

0.2624766 

0.2612677 

3 

0.2104063 

0.2090142 

4 

0.1258605 

0.1254085 

5 

0.0599238 

0.0601960 

6 

0.0236541 

0.0240784 

7 

0.0079622 

0.0082554 

8 

0.0023330 

0.0024766 

9 

0.0006045 

0.0006604 

10 

0.0001402 

0.0001585 

11 

0.0000294 

0.0000345 
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CAPITULO  3 


Variables  aleatorias  continuas 


En  este  capítulo  estudiaremos  variables  aleatorias  que  pueden  tomar  valores  en  un  intervalo  de 
números  reales. 


Función  de  densidad  de  probabilidad 

Definición: 

Se  dice  que  un  v.a.  X7  que  toma  valores  en  un  intervalo  de  números  reales,  es  continua  si 
existe  una  función  /  que  cumple  las  siguientes  condiciones: 

•  f{x)  >  0,  para  todo  x  £  R, 


'OO 


/  f(x)  dx  =  1, 


—  OO 


P{X  £  A)  =  [x)  dx ,  para  todo  subconjunto  ACM. 


La  función  /  es  llamada  función  de  densidad  de  probabilidad,  o  simplemente  función 
de  densidad  y  la  abreviaremos  como  fdp. 
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Observación: 


Para  una  v.a.  continua  X ,  la  probabilidad  de 
que  tome  valores  en  una  región  A  incluida  en 
R,  es  igual  al  área  bajo  la  curva  densidad  sobre 
esa  región.  Por  ejemplo,  si  A  =  ( a,b ),  luego  el 
área  sombreada  en  la  gráfica  corresponde  al  valor 
P{X  e  A). 


Ejemplo  3.1 


Sea  X  una  v.a.  con  función  de  densidad  dada  por: 

Íx  si  0  <  x  <  1 
1  si  1  <  x  <  1.5 
0  cc 

Luego  si  A  =  [0.3, 1.2]  podemos  calcular: 


P(X  G  A)  =  í  f(x)  dx  =  f  f(x)  dx 
JxGA  J  0.3 

=  [  f{%)  dx+  í  /( x)  dx 

J 0.3  J 1 


/  x  dx  + 
J  0.3 


1  dx  =  0.655 


Función  de  distribución  o  función  de  distribución  acumulada 


Igual  que  para  una  v.a.  discreta,  la  función  de  distribución  F  de  una  v.a.  X  continua  se  define 
como: 


F(x)  =  P{X  <  x)  para  todo  i£l. 


y,  en  este  caso,  se  calcula  como: 


F{x)  =  P(X  <  x) 


f(y )  dy 


(3.1) 


de  donde  se  deduce  que  la  función  de  distribución  de  una  v.a.  continua,  es  una  función  continua. 
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Aplicando  el  Teorema  Fundamental  del  Cálculo  Integral  en  (13.11) ,  se  obtiene  que  la  derivada  de 

la  función  de  distribución,  en  todos  los  puntos  en  los  que  la  derivada  existe,  es  la  fdp: 

dF{  x)  , 

/M  =  ^=F  (*)• 

La  función  F  preserva  las  siguientes  propiedades  que  vimos  para  el  caso  discreto,  es  decir: 

•  es  una  función  no  decreciente 

•  toma  valores  entre  0  y  1 

•  para  todo  a,  b  £  R  tales  que  a  <  b  se  cumple: 

P(a<X  <b)  =  F(b)  -  F(a) 


Como  ya  se  mencionó  antes,  la  fda  de  una  v.a.  continua  es  una  función  continua. 
Es  importante  resaltar  que  si  X  es  una  v.a.  continua  entonces: 

P(X  =  a)  =  0,  para  todo  a  €  R. 

Luego,  es  evidente  que  para  una  v.a.  continua  y  a,  b  £  R: 

P(a  <  X  <  b)  =  P(a  <  X  <  b)  =  P{a  <  X  <  b)  =  P(a  <  X  <  b) 


Ejemplo  3.2 


Sea  X  una  v.a.  con  función  de  densidad  dada  por: 


f(x)  =  < 


si  0  <  x  <  1 


— ñ  si  1  <  x  <  4 


0  cc 


Calculemos  la  fda  de  X,  es  decir,  la  expresión  de  la  función  F(x)  =  P(X  <x)=  f(t)  dt. 

J  —  OO 

La  función  /  no  tiene  la  misma  expresión  en  todo  el  eje  real,  ésto  se  muestra  a  continuación  en 
un  simple  esquema: 

0  1  4 


/(í)  =  0  f(t)  =  1/4 


/(*)  =  l/¿2 


/(*)  =  o 


Para  hallar  la  función  F  se  procede  de  la  siguiente  manera: 

x  o  i 


/X  í >X 

f(t)  dt  =  /  0  dt  =  0  - 

-oo  J  —  OO 

/x  pO  px 

f(t)  dt=  f(t)  dt+  f(t ) 

-oo  J— oo  J  0 


dt  = 


o  x  i 
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u  rx  i  x 

O  dt  +  -  dt  =  — 

~  >  ,/n  4  4 


/X  /.o  /*1  r-X 

f(t )  dt=  f(t)  dt+  /  /(í)  dí+  /  /(i)  dt  = 

-oo  J —oo  J  0  Jl 


0  1  x  4 

- - • - 3 - *- 


r°  r1 1  rx  \  5  1 

0  dt+l  -  dt+  I  —  dt  =  -  —  - 


h  t2 


/x  /»0  /*1  /»4  /*a; 

/(í)  dt=  /  /(í)  dt+  f(t)  dt+  f{t)  dt+  f{t)  dt  = 
-oo  J — oo  J  0  «/I  J  4 


0  1 


f>1 1 


i 


0  dt  I  ~ 7  dt  +  /  — ^  dt  — |—  /  O  dt  —  1 

70  4  7,  í2  74 


Esto  se  resume  así: 


Claramente,  F'(a;)  =  /(*),  para  todo  x  salvo  en  0,  1  y  4  (donde  no  es  derivable). 


EJERCICIO  3.1 

Sea  X  una  v.a.  con  función  de  distribución 


0 

si 

x  <  —  2 

F(x)  =  < 

1 

2 

3  /  x3\ 

H - (  4x - ) 

32  V  3  ) 

si 

-2  <  x  <  2 

1 

si 

x  >  2 

calcular  y  graficar  la  función  de  densidad. 


2  Sea  X  una  v.a.  con  función  de  densidad 


.  0  si 

f(x)  = 

O.04e-°  04(x-400)  si 
calcular  y  graficar  la  función  de  distribución  acumulada. 


x  <  400 
x  >  400 
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Valor  esperado  o  media 


Definición: 


Sea  X  una  v.a.  continua  con  fdp  /.  Entonces  el  valor  esperado  (llamado  también  esperanza 
matemática ,  valor  medio  o  media )  es 


E(X)  = 


(3.2) 


si  se  cumple  que 


|x|/(x)  dx  <  oo.  Si  esta  integral  diverge  se  dice  que  E(X)  no  existe. 


Ejemplo  3.3 


Consideremos  la  v.a.  X  del  Ejemplo  3.2  y  calculemos  su  esperanza: 


/oo  pO  pl  p  4  p  oo 

x/( x)  dx  =  xf{x)  dx  +  /  xf(x)  dx+  x/(x )  dx+  x/(x)  dx 
-oo  J— oo  J  O  J 1  J  4 


:  dx  - 


i ,  r 

1  ,  / 

-  dx  4-  /  x  - 

dx  +  / 

4  J i  xz  J4 

1  x2 

1 

-  dx  =  -  — 

+  ln  x| 

n 

c  4  2 

x  O  dx 


1 


=  -+ln4^  1.511 


Valor  esperado  o  media  de  una  función  de  una  v.a. 


Si  queremos  calcular  por  definición  la  esperanza  de  una  v.a.  Y,  que  es  función  de  una  v.a. 
continua  X,  deberíamos  calcular  su  fdp.  Pero,  como  en  el  caso  discreto,  hay  una  propiedad  que 
permite  realizar  el  cálculo  de  la  E(Y)  con  la  fdp  de  X. 


PROPOSICIÓN  3.1:  Sea  X  una  v.a.  continua  con  fdp  /  y  sea  h  :  R  — >  R  una  función 
cualquiera,  entonces  Y  =  h(X)  es  una  v.a.  cuya  media  se  calcula  como: 


/OO 

h{x)f{x)  dx, 

-OO 


si  se  cumple  que  /  |/i(x)|/(x)  dx  <  oo.  Si  esta  integral  diverge  se  dice  que  E(Y)  no  existe. 


La  demostración  de  esta  proposición  está  fuera  del  alcance  de  este  curso. 
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Ejemplo  3.4 


Consideremos  la  v.a.  A  del  Ejemplo  3.1  y  la  función  h(X)  =  —2X2.  Luego: 

/OO  n  OO 

h(x)f(x)dx  =  /  (  —  2  x2)/(x)dx 

-OO  J  — OO 


'  —  OO 

rO 


r*1.5 


=  /  (  —  2x2)f(x)  dx  +  /  (  —  2x2)f(x)  dx  +  /  (  —  2x2)f(x)  dx  +  /  (  —  2 x2)f(x)dx 


o 


'1.5 


'  — OO 

/»0  /»1  /*1.5  /*oo 

/  (  —  2x2)0  dx  +  /  (  — 2x2)xdx+  /  (  — 2x2)ldx+  /  (  — 2x2)0dx 

' — oo  do  J 1  J  1.5 


f  1.5 


=  -2 


r3  dx  —  2  /  x2  dx  =  —2.0833 


Recordemos  la  siguiente  propiedad  vista  para  el  caso  discreto. 

PROPIEDAD  DE  LINEALIDAD  DE  LA  ESPERANZA:  Sea  A  una  v.a.  tal  que 

£’(A)  existe  y  sean  a  y  b  dos  reales,  entonces 

E(aA  +  6)  =a£(I)  +  ii 


I  Demostración:  Sea  /(x)  la  función  de  densidad  de  la  v.a.  A  y  consideremos  la  función 
h( X)  =  aA  +  6,  a,  b  €  R.  Luego: 


/OO 

(ax  +  b)f(x)  dx 

-OO 

/OO 

(ax/(x)+6/(x))dx 

-oo 

/OO  /«OO 

xf(x)dx  +  b  f{x)dx 
-oo  J  — oo 

=  aE{X)  +  b 


(por  Proposición  3.l) 
(distributiva) 
(por  propiedades  de  integrales) 
(por  (13.21)  y  por  definición) 


PROPIEDAD  3.1:  Sea  A  una  v.a.  continua  tal  que  E( A)  existe,  entonces 

E( X  -  E( A))  =  0 


I  Demostración  Como  E( A)  existe,  la  llamamos  /.¿  (c{ue  es  un  número).  Consideremos  la  función 
h{ A)  =  A  —  //.  Notar  que  esta  función  es  lineal  en  A,  es  decir,  ú(A)  =  aA  +  b,  donde  a  =  1  y 
b  =  —/x.  Entonces,  aplicando  la  Propiedad  de  Linealidad  tenemos  que: 

E(h(  A))  =  E(  A)  +  (-/x)  =ii-iji  =  0 
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Varianza  y  desviación  típica 


Como  ya  dijimos  en  el  caso  discreto,  la  varianza  de  una  v.a.  da  un  idea  de  la  dispersión  de  la 
distribución  de  la  variable  alrededor  de  su  valor  medio  y  se  define  como: 


Definición: 

Si  X  es  una  v.a.  con  media  E(X),  definimos  (si  existe) 

var(X)  =  e\(X  -  E{X)Y 
y  la  desviación  típica  (o  estándar) 

dt(X)  =  \/  var(X) 


Recordar  que  dt(X)  se  expresa  en  las  mismas  unidades  que  la  v.a.  X. 

También  vale,  para  el  caso  continuo,  la  Propiedad  2.4:  sea  X  una  v.a.  tal  que  existe  su  varianza 
y  sean  a  y  b  dos  constantes,  entonces: 


var(aX  +  b)  =  a2var(X) 


(3.3) 


Ejemplo  3.5 


Considerar  nuevamente  la  función  de  densidad  del  Ejemplo  3.1.  Para  poder  calcular  var(X), 
primero  debemos  calcular  E(X)\ 


/oo  eO  el  el. 5  eoo 

xf{x)  dx  =  xf{x)  dx+  xf(x)  dx+  xf(x)  dx+  xf(x)  dx 
-oo  J- oo  J  0  J 1  Jl.  5 


f1  2  ,  í15  ,  23 

=  x  dx  +  x  dx  =  — 

Jo  J 1 


24 


Luego,  por  la  Proposición  3.1  y  considerando  h(X)  =  (A'  —  E{ X))“: 


var(X)  =E  (X  -  E( X)f 


=  E 


'  —  OO 
eO 


'  — oo 

el. 5 


2  „  23  /  23 

x2  -  2x—  +  — 

24  \24 

'  2  23  529 

X'-~2X+  576 


-s 


f(x)  dx 


x  ~  )  /( x)  dx 


0  dx 


o  23  529 

*  -l2-T+576 


'  2  23  529 

X  ~  12X+  576 
23 


1  dx  + 


529 


'1.5  L 


'  2  23  529 

X  _  12X+  576 
/■1.5 


dx 


0  dx 


23 


cl.5 


529 


/■1.5 


=  /  x3  dx - /  x2  dx  H - x  dx  +  x2  dx - /  x  dx  H - /  1  dx 

Jo  12  Jo  576  J o  A  12  A  576  A 

1  23  529  19  115  529  71  „ 

=  0.1233 


4  36  1152  24  96  1152  576 
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EJERCICIO  3.2 

La  demanda  semanal  de  gas  propano  (en  miles  de  galones)  de  una  distribuidora  particular  es  una 
v.a.  con  fdp  dada  por: 

{2(1 - r|  si  1  <  x  <  2 

V 

0  cc 

Calcular  la  demanda  semanal  esperada  y  el  desvío  estándar. 


Cálculo  explícito  de  la  varianza 


De  la  misma  manera  que  se  realizó  para  v.a.  discretas  (en  la  Propiedad  |3j3) ,  para  obtener 
explícitamente  var(X),  desarrollamos  el  cuadrado  en  la  definición  y  calculamos  la  media  de  la 
función  de  X  usando  la  Proposición  3.1,  obteniendo  así: 

var(X)  =  E( X2)  -  ( E(X ))2 


I  Demostración  Sea  /(x)  la  función  de  densidad  de  la  v.a.  X,  E(X)  =  ¡i  y  h(X)  =  ( X  —  ¿r)2. 
Entonces: 


/OO 

( x  —  /i)2 /(x)  dx 

-OO 

/OO 

(x2  —  2 x/i  +  f. ¿2)/(x )  dx 

-OO 

/OO  /'OO  cOO 

x2f{x)dx—  /  2  xfif(x)dx+  /  /. i2f(x)dx 

-oo  J —oo  J  — OO 

/OO  /»00  cOO 

x2 f{x)  dx  —  2¿/  /  xf(x)  dx  +  n2  /  /(x)  dx 
-oo  J  — oo  J  — oo 

=  £(X2)  -  2/i£(X)  +  /^2  =  E(X2)  -  2/1/j,  +  í¿2 
=  E(X2)  -  n2  =  E{X2)  -  (E(X))2 


(por  Proposición  3.l) 
(desarrollando  el  cuadrado) 
(distribuyendo) 


(por  definición) 


Ejemplo  3.6 


Sea  X  una  v.a.  con  función  de  densidad  dada  en  el  Ejemplo  3.1.  Veamos  cuanto  vale  var(3  —  2X). 
Podemos  utilizar  m,  donde  a  =  —2  y  b  =  3,  entonces 

var( 3  -  2V)  =  (-2)2  var(X)  =  4  x  ^  ^  -  0.4931 


Si  X  tiene  media  //  y  varianza  a2  la  “variable  estandarizada” 


X  -  E(X)  _  X  -  n 
dt(X)  a 


(3.4) 


59 


tiene  media  O  y  varianza  1,  que  se  obtienen  fácilmente  de  las  propiedades  de  esperanza  y  varianza. 


EJERCICIO  3.3 

1  Demostrar  que  para  la  v.a.  Z ,  definida  en  (13.41).  vale  E(Z)  =  0  y  var(Z)  =  1. 

2.  En  referencia  al  Ejercicio  3.2.  Si  hay  2500  galones  en  existencia  y  no  se  recibe  nuevo  suministro 
durante  la  semana.  ¿Cuántos  de  los  2500  galones  se  espera  que  queden  al  fin  de  la  semana? 
Opcional:  ¿Cómo  cambiarían  los  cálculos  si  la  existencia  al  principio  de  la  semana  fuera  de 
1500  galones? 


Otras  medidas  de  resumen  de  una  variable  aleatoria 

Definición: 

Sea  a  un  número  entre  0  y  1,  se  define  el  cuantil— a  de  la  v.a.  X  (discreta  o  continua)  con 
función  de  distribución  F,  como  el  número  cc(a)  tal  que  F(x(a))  —  a. 

El  cuantil— a  se  suele  llamar  también  percentil  100a  %. 


Aclaración 

Los  cuantiles  para  a  =  0.25, 0.50  y  0.75  se  llaman  primer  cuartil,  mediana  o  segundo  cuartil, 
y  tercer  cuartil  respectivamente. 


Para  v.a.  continuas  se  calculan  los  cuantiles  de  la  siguiente  forma,  para  cualquier  0  <  a  <  1,  el 
cuantil— a,  es  el  valor  x(a),  tal  que: 


F(x(a))  =  P(X  <  x 


f(x )  dx  =  a 


En  los  siguientes  gráficos  veremos  como  representar  el  cuantil  a: 
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En  la  Gráfica  1,  se  ubicará  x(a)  en  el  eje  x  de  modo  que  el  área  debajo  de  la  curva  de  la  función 
de  densidad  /  desde  — oo  hasta  x(a)  sea  igual  a  a.  En  la  Gráfica  2  se  ubicará  el  valor  a  sobre  el  eje 
y,  trazando  una  recta  paralela  al  eje  x  que  pase  por  a,  ésta  cortará  a  la  curva  F(x)  en  un  punto 
cuya  abscisa  es  x(a). 

En  particular,  para  a  =  0.5,  la  notación  del  cuantil— 0.5  (mediana)  es  p 


F(p)  =  í  /( x)  dx  =  0.5 

J  —  OO 


Ejemplo  3.7 


Sea  X  la  v.a.  del  Ejemplo  3.2,  busquemos  su  mediana.  Recordemos  que  obtuvimos  como  f.d.a. 
de  la  v.a.  X  la  siguiente  expresión: 


0 

si 

x  <  0 

X 

4 

5 

1 

SI 

0  <  x  <  1 

— 

si 

1  <  x  <  4 

4  ~ 

X 

1 

si 

x  >  4 

Como  esta  función  es  continua  y  no  decreciente,  hay  que  evaluarla  en  los  valores  donde  cambia 
su  definición  para  determinar  el  intervalo  al  que  pertenece  la  mediana  de  la  v.a.  X.  Es  claro  que 
en  los  intervalos  (— oo,  0)  y  (4,  oo)  no  va  a  estar  el  valor  de  p,  pues  F(x)  =  0  para  todo  x  <  0  y 
F(x)  =  1  para  todo  x  >  4.  Al  evaluar  F  en  x  =  1  se  obtiene  F(  1)  =  1/4  y  como  1/4  <  1/2,  se 
puede  asegurar  que  p  >  1,  es  decir,  p  £  (1,4).  Luego  para  los  valores  en  ese  intervalo  planteamos: 

5  1  4 

F(p)  = - =  0.5  obteniendo  que  p  = 

4  /i  3 

Veamos  gráficamente  su  ubicación: 
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EJERCICIO  3.4 

Para  determinar  el  grado  de  inteligencia  de  un  ratón,  se  mide  el  tiempo  que  tarda  en  recorrer  un 
laberinto  para  encontrar  la  comida  (estímulo).  El  tiempo  (en  segundos)  que  emplea  un  ratón  es 
una  v.a.  Y  con  fdp  dada  por: 

í  b 

0  si  y  >  b 

f(y)  =  \  y2 

lo  cc 


donde  b  >  0.  Calcular  los  cuartiles  de  la  distribución.  Graficar. 
¿Es  posible  calcular  su  esperanza?  Justificar. 


Algunas  variables  aleatorias  continuas 


Distribución  uniforme 


Ejemplo  3.8 


Supongamos  que  una  persona  toma  un  colectivo  para  ir  al  trabajo,  que  pasa  exactamente  cada 
5  minutos.  Si  sale  de  su  casa  sin  tener  en  cuenta  la  hora,  el  tiempo  (medido  en  minutos)  que 
tiene  que  esperar  en  la  parada  es  una  v.a.  X,  que  puede  tomar  cualquier  valor  en  el  intervalo 
[0,  5],  la  función  de  densidad  para  esta  variable  es: 


/(a 0 


1/5  si  0<x<5 

0  cc 


Es  evidente  que  f{x)  >  0  para  todo  x  y  que  el  área  total  bajo  /( x)  es  igual  a  1. 
Luego,  la  probabilidad  de  que  tenga  que  esperar  entre  1  y  3  minutos  es: 


1 

<f(x) 

P(  1  <  X  <  3)  =  í  ^  dx  =  ^  o.i  - 

ii  5  5 

X 

0 

2 

- i - w  r 

14  5  6 
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Este  ejemplo  es  el  de  una  v.a.  con  distribución  uniforme  en  el  intervalo  [0,5]. 


Definición: 


Una  v.a.  tiene  distribución  uniforme  en  el  intervalo  [a,  b]  (a,  b  £  R  y  a  <  b),  si  su  función 
de  densidad  está  dada  por: 


/O) 


- -  si  a  <  x  <  b 

b  —  a 

0  cc 


Notación 

Si  la  v.a.  X  tiene  distribución  uniforme  en  el  intervalo  [a,  b]  lo  denotamos  como  X  ~  U[a,b\. 


/OO 

f(x)  dx  =  1. 

-OO 

Su  función  de  distribución  está  dada  por: 


F(x)  = 


0  si 

x  —  a 


b  —  a 
1  si 


x  <  a 
si  a  <  x  <  b 
x  >  b 


PROPOSICIÓN  3.2:  Si  X  ~  U[a ,  b]  entonces: 


#  E(X) 


b  +  a 
2 


•  var(X) 


(a  —  b)2 
12 


Demostración:  Calculemos  primero  la  media  de  la  v.a.  X: 


E(X)  =  í  xf(x)  dx  =  í 

J  —  oo  J  a 


i 


(b  +  a)  = 


0  1  ,  1  x¿ 

x  - - dx  =  - -  — 

b  —  a  b  —  a  2 

b  +  a 


1 


2(b  —  a) 


(b2~a2) 


2 :jC6 — trX  ^  v"  1  2  ’ 

es  decir,  la  media  de  una  distribución  uniforme  es  el  punto  medio  del  intervalo. 
Ahora,  para  calcular  la  varianza,  calculamos  primero 


/oo  />b  i 

x2  f(x)  dx  =  x2  - — 

-oo  Ja  O 


,  1  X3 

dx  =  - -  — 

—  a  b  —  a  ó 


1 


3  (b  —  a) 


(b3  —  a3) 


3 


Xb^rff(a2  +  ab  +  b2)  = 


a 


2  +  ab  +  b2 


Luego 


var(X)  =  E(X2)  -  (EX)2  = 


a2  +  ab  +  b2  (  b  +  a  \  “  a2  +  ab  +  b2  b2  +  2 ab  +  a2 


4(a2  +  ab  +  b2)  —  3(62  +  2  ab  +  a2)  a2  —  2  ab  +  b2  (a  —  b )2 


12 


12 


12 
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Si  X  ~  U[a,b],  para  calcular  su  mediana,  buscamos  cuál  es  el  valor  ¡1  para  el  cual  F{p)  =  0.5. 
Es  claro  que  este  valor  se  encuentra  entre  a  y  5,  entonces  planteamos: 


F{p) 


fi  —  a 
b  —  a 


=  0.5 


y  despejando,  obtenemos: 


med(X)  =  fí  = 


b  +  a 
2 


En  este  caso  la  mediana  y  la  media  coinciden.  Esto  ocurre  siempre  que  la  distribución  es  simétrica. 
Gráficamente  tenemos: 


EJERCICIO  3.5 

Si  un  paracaidista  cae  en  un  sitio  aleatorio  de  la  línea  entre  los  puntos  A  y  B. 

1  Encuentre  la  probabilidad  de  que  caiga  más  cerca  de  A  que  de  B. 

2,  Calcule  la  probabilidad  de  que  la  distancia  con  respecto  a  A ,  sea  más  de  3  veces  la  distancia 
respecto  de  B. 


Distribución  exponencial 


Definición: 


Una  v.a.  X  se  dice  que  tiene  distribución  exponencial  con  parámetro  A,  con  A  >  0,  si  su 
función  de  densidad  está  dada  por: 


f(x) 


\e~Xx  si  x>0 
0  si  x  <  0 


Notación 

Si  X  tiene  distribución  exponencial  con  parámetro  A  lo  denotamos  como  X  ~  Exp(X). 
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Si  ~  Exp{\)  es  fácil  ver  que  su  función  de  densidad  cumple  con  f(x)  >  0  para  todo  x  £ 

/OO 

f(x)  dx  =  1.  Su  función  de  distribución  está  dada  por: 

-OO 


F{  x) 


í  f(t )  dt  = 

J  —  OO 


1  —  e  Xx  si  x  >  0 
0  si  x  <  0 


PROPOSICIÓN  3.3:  Si  A  ~  Exp{ A)  entonces: 

•  E{  X)  =  1/A 

•  var(X)  =  1/A2 


I  Demostración:  Primero,  por  definición,  tenemos  que: 

/OO  pOO  p 

xf(x)  dx  =  I  x\e~Xx  dx  =  A 
-oo  J  0  j  0 


OO 

xe 


~Xx  dx 


=  A  lím 

b—too 


/O 

0-\x  b 


A 


rbe~  Xx 


o  +  Jo  A 


dx 


=  A 


__e~\x  bT  ^ 

0  +  lím  — — 

b—>  oo  0 


A 


Luego,  por  otro  lugar,  tenemos  que: 

/OO  /*( 

x2f{x)  dx  =  A  / 

-oo  J  0 


x2e~Xx 


dx 


=  A  lím 

6— >■  oo 


_ Ax  5 


=  A 


o 

2  /  />b 
0  +  —  lím  /  a;e 
A  b—>oo  V  Jq 


„  fbxe  Xx  , 
+  2  /  — - —  dx 

Jo  A 

~Xxdx 


=  2  lím 

b—too 


—xe 


—Xx 


b  pb  —Xx 
+  /  -—dx 


1  2 
~2  A2  “  A2 


Por  último 


var(X)  =  E{X2)  -  ^(A))' 


(integrando  por  partes) 


(integrando  por  partes) 


(integrando  por  partes) 


A2 


1 

A2 


Si  A  ~  Exp{\)1  para  calcular  la  mediana,  buscamos  el  valor  de  ¡i  tal  que  F(jl)  =  0.5.  Sabemos 
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que  ¡1  >  O,  entonces  planteamos: 


F{fi)  =  1  -  e~Xil  =  0.5 


Despejando,  obtenemos  que: 


med(X)  =  jl  = 


ln  2 


En  este  caso  puede  verse  que  la  mediana  es  menor  que  la  media  (1/A). 


PROPIEDAD  DE  AUSENCIA  DE  MEMORIA:  Dada  una  v  a.  T  ~  Exp(X),  si  t  >  0 
y  s  >  0  se  cumple  que: 

P(T>t  +  s\T>  s)=P(T>t)  (3.5) 


I  Demostración:  Aplicando  la  definición  de  probabilidad  condicional,  tenemos  que: 

T  >  t  S  9  9 - 


P(T  >t  +  s\T  >  s)  = 


P(T  >  s ) 

P(T  >t  +  s )  1  -  P(T  <t  +  s) 

P(T  >  s)  ~  1  -  P{T  <  s) 

1  —  F(t  +  s)  _  1  —  (l-e-A(t+s)) 


1  ~F{s) 

o  —  A(í-|-s) 


1  -  (l  -  e_As) 


A t  s 


o  A  s 


o— As 


=  e 


—  Ai 


e~ 

Ahora,  si  calculamos  la  probabilidad  del  lado  derecho  en  (13.51)  obtenemos  que: 

P(T  >t)  =  1  -  P(T  <  t)  =  1  -  F(t)  =  1  -  (1  -  e_Aí)  =  e~xt 


t  +  S 


En  consecuencia  P(T  >  t  +  s|T  >  s)  =  P(T  >  t). 
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Ejemplo  3.9 


Sea  X  una  v.a.  con  distribución  exponencial  con  A  =  0.2.  Sabiendo  que  X  >  2,  calculemos  la 
probabilidad  de  que  X  >  5: 


P(X  >  5  \X  >  2)  =  P(X  >  3)  =  e"3x0-2  =  0.5488 


Relación  con  un  proceso  de  Poisson 

Pensemos  en  un  proceso  temporal  de  Poisson  de  tasa  c,  y  consideramos  el  tiempo  T  transcurrido 
desde  el  inicio  del  proceso  hasta  que  se  presenta  el  primer  “evento”  del  mismo.  Entonces,  para 
cualquier  t  >  0,  el  evento  (T  >  t)  significa  que  en  el  intervalo  de  tiempo  [0,  í]  no  ocurre  ninguno  de 
los  “eventos”  del  proceso.  Si  definimos  Xt  como  el  número  de  “eventos”  que  ocurren  en  el  intervalo 
[0,  t],  sabemos  que  Xf  ~  P(ct)  y  podemos  decir: 

P(T  >  t)  =  P(Xt  =  0)  =  e~ct  (recordar  que  t  >  0) 

Entonces  podemos  determinar  la  función  de  distribución  de  esta  v.a.  T : 

P{T  <t)  =  1  -  P(T  >  t)  =  1  -  e~ct  si  t  >  0 
así  hemos  demostrado  que  T  ~  E{c). 

También  puede  demostrarse  que  el  tiempo  transcurrido  entre  dos  “eventos”  sucesivos  de  un 
proceso  de  Poisson  de  tasa  c,  tiene  distribución  exponencial  con  parámetro  A  =  c. 


Ejemplo  3.10 


Suponga  que  se  reciben  llamadas  en  una  línea  telefónica  de  emergencias  las  24  hs  del  día,  según 
un  proceso  de  Poisson  con  una  tasa  0.5  llamadas  por  hora.  ¿Cuál  es  la  probabilidad  de  que 
transcurran  más  de  dos  horas  entre  dos  llamadas  sucesivas? 

La  v.a.  T,  el  tiempo  (medido  en  horas)  entre  dos  llamados  sucesivos,  tiene  distribución 
exponencial  con  A  =  0.5.  Entonces 

P(T  >  2)  =  1  -  P{T  <  2)  =  1  —  (1  —  e_0'5x2)  =  0.3679 
es  la  probabilidad  pedida. 


EJERCICIO  3.6 

Sea  X  el  tiempo  (en  días)  entre  dos  fallas  sucesivas  de  un  equipo,  X  es  una  v.a.  que  tiene  distri- 
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bución  exponencial  con  A  =  0.023.  Calcular: 


1 .  La  probabilidad  de  que  el  equipo  funcione  sin  fallas  durante  al  menos  42  días. 

2.  Si  el  equipo  ha  trabajado  sin  fallas  durante  12  días,  ¿cuál  es  la  probabilidad  de  que  en  total 
funcione  sin  fallas  más  de  30  días? 

3.  ¿Cuál  es  la  probabilidad  de  que  haya  más  de  un  falla  en  30  días? 

La  distribución  normal 

Definición: 

Una  v.a.  X  tiene  distribución  normal  con  parámetros  ¿¿  (donde  ¿i  £  K.)  y  a1  (donde  a  >  0) 
si  su  función  de  densidad  está  dada  por: 


f{x)  = - g-U-M)2/^2)  para  todo  x  e  R 


Notación 


Si  la  v.a.  X  tiene  distribución  normal  con  parámetros  ¿i  y  er2,  se  indica  X  ~  ÍV(¿í,  cr2). 


Observación: 

La  gráfica  de  la  función  de  densidad  /  de  una  v.a.  X  ~  N(fi,  a2)  es  simétrica 
respecto  de  ¿t,  pues  /(¿t  +  x)  =  —  x). 


|/(z) 


Eje  de  simetría 


! 


-2  -1  0 


1 


2 


3 


4 


5  6  7  8  9  10 
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Observación: 

El  siguiente  gráfico  corresponde  a  las  funciones  de  densidad  /  de  variables  con 
distribución  normal  con  /i  =  4y  diferentes  valores  de  o2 . 


Observación: 

El  siguiente  gráfico  corresponde  a  las  funciones  de  densidad  /  de  variables  con 
distribución  normal  con  er2  =  1  y  diferentes  valores  de  fx. 


PROPOSICIÓN  3.4:  Si  X  ~  N{^cr2)  entonces: 

•  E(X)  =  /i 

•  var(X)  =  a2 

•  dt(X)  =  a 


La  demostración  de  esta  proposición  escapa  los  alcances  de  este  libro. 

r 

En  cuanto  al  cálculo  de  la  función  de  distribución  F(x)  =  /  f(t)  dt  no  se  puede  encontrar 

J  —  OO 

una  fórmula  explícita  de  esta  función,  ya  que  la  función  f(x)  no  tiene  primitiva.  Para  calcular 
una  probabilidad  que  involucre  a  una  v.a.  con  distribución  N(/j,,<t2)  habría  que  hacer  el  cálculo 
utilizando  métodos  numéricos. 
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Veremos  otro  camino  para  resolver  este  problema  en  donde  cobra  un  rol  de  gran  importancia 
el  caso  de  fj,  =  0  y  a  =  1. 

Definición: 

Una  v.a.  Z  tiene  distribución  normal  típica  o  estándar  si  su  densidad  está  dada  por: 

<¡>(z)  =  _ e~z  /2  para  z  £  R. 

v  27T 

La  función  (t>{z)  es  simétrica  respecto  de  0  como  se  muestra  en  la  siguiente  gráfica. 


Notación 

Si  la  v.a.  Z  tiene  distribución  normal  típica,  se  indica  Z  ~  ÍV(0, 1). 

Si  Z  tiene  esta  distribución,  entonces  E(Z)  =  0  y  var(Z)  =  dt(Z)  =  1,  por  la  Proposición  3.4. 
Llamamos  <í>(z)  a  su  función  de  distribución  acumulada.  Esta  función  se  calcula  por  métodos 
numéricos  y  está  tabulada  para  valores  de  z  entre  -3.49  y  3.49  (en  el  Apéndice  B). 

Por  ser  <f>  simétrica,  la  función  $  cumple: 

$(-«)  =  1  -  $(a)  (3.6) 


Gráficamente  tenemos: 


$(-a)  =  1  -  $(a) 
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Se  deduce  de  (13.611  que  los  cuantiles  de  la  N( 0, 1)  cumplen 


z(  1  —  a)  =  — z(ol ) 

pues  <f>(  —  z(a))  =  1  —  $  (z(a))  =  1  —  a.  En  particular  la  mediana  (o  segundo  cuartil) 

med(Z)  =  jl  =  2(0.5)  =  0 


A  continuación  se  presentan  en  la  gráfica  de  la  función  (f>  los  3  cuartiles  de  la  v.a.  Z  ~  N( 0, 1): 
primer,  segundo  y  tercero. 


PROPOSICIÓN  3.5:  Si  X  ~  A(/¿,  cr2),  entonces  para  a,  b  G  M  y  cualquier  a  ^  0,  se 
verifica  que: 

Y  =  aX  +  b  ~  N{a^L  +  b,a2a2) 


Fácilmente  se  puede  demostrar  que  E(Y)  =  a^i  +  b  (por  la  Propiedad  de  Linealidad  de  la 
esperanza)  y  VariY)  =  a2a2  (por  (13.31)  1.  Pero  la  demostración  de  que  la  v.a.  Y  tiene  distribución 
normal  está  fuera  del  alcance  de  este  libro. 


COROLARIO  3.1:  Si  X  ~  iV(/qcr2)  la  variable  estandarizada  Z 
bución  ÍV(0, 1). 


X  —  n 

a 


tiene  distri- 


Demostración:  Notemos  que 


-A¿ 


a  a  a 

Entonces,  por  la  Proposición  3.5,  definiendo  a  =  ^  y  b  =  — ,  tenemos  que 

a/i  +  b  =  —/i  +  - — —  =  0 
a  cr 


aVz  =1-1  =  1 


Por  lo  tanto,  Z  ~  N(Q,  1). 
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Entonces,  para  calcular  probabilidades  correspondientes  a  una  v.a.  X'  con  distribución  N{¡i1  a 2), 

se  realiza  la  transformación  Z  =  - —  y  se  trabaja  con  la  distribución  N( 0, 1).  Por  lo  tanto,  si 

<j 

a  <  b  : 


P(a<X<b)  =  Pl^<^<b->‘ 


=  p  ,'a- V  <  X-  ¡i  <  b- n 
a  ~  a 
b  —  n' 


=  P[a-^<z< 


=  $  (  - — —  )  -  $ 


a 

a  —  ¡i 
a 


(por  ser  v.a.  continua) 


y  de  la  misma  forma: 


F(x)  =  P(X  <  x) 
_  p ~ V 


=  $ 


a 

x  —  ¡i 
a 


para  todo  x  G 


Ejemplo  3.11 


Sea  X  ~  X(30,4),  se  desea  calcular  P( 28  <  X  <  31): 


v  „  .'28  —  30  X  -  30  31  -  30 

P(28  <  X  <  31)  =  P  (  — - —  <  — - —  < 


=  P  -1< 


2  2 
X  —  30 


<  1/2 


=  P(-l  <  Z  <  1/2) 
=  $(0.5)  -  $(-l) 

=  0.6915  -  0.1587 
=  0.5328 
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Observación: 

Se  puede  ver  que  para  cualquier  variable  aleatoria  X  con  distribución  N(¡jl,  a2) 
se  cumplen  las  siguientes  igualdades: 


Estas  igualdades  caracterizan  a  la  distribución  normal. 

En  particular,  aunque  una  v.a.  normal  puede  tomar  valores  entre  —  oo  e  oo, 
es  “casi  imposible”  que  tome  valores  que  se  alejen  de  ¿¿  en  más  de  3er,  ya  que 
P( \X  —  n\  >  3er)  =  1  —  0.9974  =  0.0026.  Esta  propiedad  se  utiliza,  por  ejemplo, 
en  control  de  calidad. 


Ejemplo  3.12 


Una  fábrica  produce  tornillos,  las  especificaciones  indican  que  el  diámetro  de  los  mismos  debe 
estar  entre  1.19  y  1.21  pulgadas.  Si  el  proceso  de  producción  es  tal  que,  el  diámetro  de  los 
tomillos  es  una  v.a.  con  distribución  normal  con  media  1.196  y  desviación  estándar  0.005,  ¿qué 
porcentaje  de  la  producción  no  satisface  las  especificaciones? 

Sea  X  la  v.a.  que  mide  el  diámetro  de  los  tornillos,  X  ~  N(  1.196,  0.0052).  Queremos  calcular 
el  porcentaje  de  la  producción  que  no  satisface  las  especificaciones,  para  ello  calcularemos  primero 
la  probabilidad  de  que  se  cumplan  las  especificaciones: 


P(1.19  <  X  <  1.21)  =  P 


1.19-  1.196  X-  1.196  1.21  -  1.196 

<  — vzzzz —  < 


0.005 


0.005 


0.005 


=  P(-1.2  <  Z  <  2.8)  =  $(2.8)  -  $(-1.2)  =  0.9974  -  0.1151  =  0.8823 


Luego,  por  la  propiedad  de  la  probabilidad  del  complemento,  la  probabilidad  de  que  no  cumplan 
las  especificaciones  es  1  —  0.8823  =  0.1177  .  Por  lo  tanto,  el  porcentaje  de  la  producción  que  no 
satisface  las  especificaciones  será  11.77%. 
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Utilizando  el  Corolario  3.1,  se  prueba  que  los  cuantiles  de  una  variable  X  con  distribución 
N(n,a2)  cumplen: 

x(a)  =  n  +  a  x  z(a) 

donde  z(a)  son  los  cuantiles  de  1V(0, 1). 

En  particular,  la  mediana  de  una  v.a.  X  ~  7V(/i,  a2)  es: 

med(X)  =  a;(0, 5)  =  /i 


Ejemplo  3.13 


Calcularemos  los  cuantiles  0.80  y  0.20  de  una  variable  normal  X  con  media  5  y  desviación  2. 
De  la  Tabla:  d>(0.84)  =  0.7995  y  $(0.85)  =  0.8023.  Usando  el  valor  más  próximo  2(0.8)  =  0.84 
y  por  lo  tanto,  a;(0.8)  =  5  +  2  x  0.84  =  6.68.  Para  el  otro  cuantil  usamos  2(0.2)  =  —2(0.8)  y  por 
lo  tanto,  x(0.2)  =  5  +  2  x  (—0.84)  =  3.32. 


EJERCICIO  3.7 

Hallar  los  parámetros  /r  y  a  de  la  v.a.  X  normal  cuya  mediana  vale  -3  y  la  gráfica  de  su 
densidad  es 


Modelo  de  mediciones  con  error 

Cuando  se  realiza  cualquier  medición,  siempre  se  cometen  errores.  Los  errores  pueden  ser  sis¬ 
temáticos,  como  en  el  caso  de  una  balanza  mal  calibrada  que  siempre  da  un  valor  superior  (o 
inferior)  al  verdadero,  o  pueden  ser  aleatorios.  En  muchas  situaciones  los  errores  sistemáticos  pue¬ 
den  y  deben  ser  eliminados,  por  ejemplo  calibrando  correctamente  la  balanza,  en  otras,  cuando  se 
conoce  la  magnitud  del  error,  puede  corregirse  el  resultado  de  la  medición  restando  (o  sumando, 
según  sea  el  caso)  el  valor  del  error  sistemático.  Por  otra  parte  los  errores  aleatorios  nunca  pueden 
ser  completamente  eliminados.  Los  errores  que  podemos  tratar  en  estadística  son  los  errores  alea¬ 
torios.  Debido  a  los  errores  aleatorios  cuando  repetimos  una  medición,  en  idénticas  condiciones, 
los  resultados  de  esas  mediciones  no  son  constantes,  y  varían  alrededor  de  un  valor  medio. 
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Entonces,  consideramos  el  resultado  de  una  medición,  como  una  variable  aleatoria  X  =  ¡jl  +  e, 
donde  /z,  si  no  hay  error  sistemático,  es  el  verdadero  valor  de  la  magnitud  que  se  está  midiendo  y  e 
es  el  error  aleatorio,  que  tiene  mediana  0  (esto  indica  que  es  igualmente  probable  que  el  error  sea 
positivo  o  negativo). 

Generalmente  este  tipo  de  error  se  modeliza  con  una  distribución  normal  con  media  0  y  varianza 
<7,  el  valor  de  la  varianza  depende  de  la  precisión  del  método  de  medición.  Entonces,  bajo  este 
modelo,  consideramos  el  resultado  de  una  medición  como  una  variable  aleatoria:  X  =  ¡i  +  e,  donde 
/i  es  el  verdadero  valor  y  e  tiene  distribución  N(0,a2),  lo  que  es  equivalente:  X  ~  N(p,,a2). 
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CAPITULO  4 


Sumas  de  variables  independientes  y  Teorema 
Central  del  Límite 


En  muchas  situaciones  experimentales  se  presentan  más  de  una  v.a.  de  interés.  Aquí  se  descri¬ 
birán  algunas  combinaciones  lineales  de  varias  v.a.,  enfocándonos  especialmente  en  el  caso  de  v.a. 
independientes. 


Esperanza  y  varianza  de  una  combinación  lineal  de  variables 
aleatorias 


Dadas  dos  v.a.  X  e  Y  y  dos  constantes  a,  b  reales,  se  verifica: 

E(aX  +  bY)  =  aE{X)  +  bE{Y)  (4.1) 

var{aX  +  bY)  =  a2var(X)  +  b2var(Y)  +  2 ab  cov(X,  Y) 

donde  cov(X,  Y)  es  la  covarianza  entre  X  e  Y,  que  es  un  parámetro  que  depende  de  la  distribución 
conjunta  de  las  v.a.  Cuando  las  variables  aleatorias  son  independientes  cov(X,Y)  =  0,  entonces: 

var{aX  +  bY)  =  a2var(X)  +  b2var(Y)  (4.2) 
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Observación: 

Es  importante  recordar  que  la  igualdad  63  es  válida  solamente  cuando  las 
variables  aleatorias  son  independientes. 


Ejemplo  4.1 


Sea  X  una  v.a.  con  media  2  y  desvío  5.  Sea  Y  otra  v.a.  con  media  —3  y  varianza  4.  Si  X  e  Y 
son  v.a.  independientes,  entonces: 

E( 2X  -Y)  =  E(2X  +  (-l)y)  =  2 E(X)  +  (-1  )E(Y)  =  2x2+  (-1)  x  (-3)  =  7 
var( 2X  -  Y)  =  var( 2X  +  (-l)F)  =  2 2var{X)  +  (-1  )2var(Y)  =  4  x  52  +  1  x  4  =  104 

■ 

Las  igualdades  (OH  y  m  se  generalizan  para  una  combinación  lineal  de  n  variables  aleatorias. 


PROPOSICIÓN  4.1:  Sean  n  v.a.  Xi,  X2,  . . .,  Xn  y  n  constantes  reales  ai,  a 2,  ■  . .,  an. 
Si  Y  es  la  combinación  lineal  Y  =  aiÁ'i  +  a 2X2  +  •  •  •  +  anXn,  entonces  la  esperanza  y  la 
varianza  de  Y  se  calculan  como: 

(n  \  n 

j  =J2^E(Xi), 

2  —  1  /  2—1 

(n  \  n  n  n 

E  =  E  a^Var(Xi)  +  2  jCoviX^Xj).  (4.3) 

¿= i  /  ¿= i  ¿=i  j=i 

j>i 

Si  las  v.a.  Xi  son  independientes  entre  sí,  tendremos  que  cou(X¿,  X,¡ )  =  0,  para  todo  i  ^  j, 
y  la  expresión  da  se  reduce  a: 

(n  \  n 

ciiXi  )  =  var(Xi) 

i=  i  /  t=l 


Destacamos  especialmente  el  caso  de  v.a.  independientes,  porque  en  los  próximos  capítulos 
usaremos  frecuentemente  conjuntos  de  v.a.  independientes. 


Distribución  de  una  combinación  lineal  de  variables  aleatorias 
normales  independientes 


La  familia  de  distribuciones  normales  tiene  una  importante  propiedad,  dada  en  la  siguiente 
proposición. 
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PROPOSICIÓN  4.2:  Sean  n  v.a.  independientes  X\,  X2,  . ..,  Xn.  donde  cada  X, 
tiene  distribución  N(pi,af)  y  sean  n  constantes  reales,  a\ ,  a2,  ■  ■ .,  ara.  Si  la  v.a.  Y  es 
la  combinación  lineal 

Y  =  aiAi  +  a2X2  +  •  •  •  +  a,nXn 
entonces  Y  tiene  distribución: 

(n  n 

i=  1  i=l 


La  demostración  de  esta  propiedad  está  fuera  del  alcance  de  este  curso. 

Este  resultado  de  la  familia  de  distribuciones  normales,  sumamente  importante,  no  vale  en 
general  para  cualquier  distribución. 


Ejemplo  4.2 


En  una  población  adulta  la  distribución  del  peso  es  normal.  Para  las  mujeres  la  media  es  60  kg 
y  el  desvío  9  kg ,  para  los  hombres  la  media  es  74  kg  y  el  desvío  10  kg.  Un  hombre  y  dos  mujeres 
entran  a  un  ascensor  cuya  carga  máxima  es  de  250  kg,  ¿cuál  es  la  probabilidad  de  que  no  se 
supere  esa  carga  máxima? 

Si  definimos  el  peso  de  estas  tres  personas  como  las  siguientes  v.a.: 


X  =  “peso  (en  kg)  de  la  primer  mujer”, 

Y  =  “peso  (en  kg)  de  la  segunda  mujer”  y 
Z  =  “peso  (en  kg)  del  hombre” , 


el  peso  total  de  estas  tres  personas  es  W  =  X  +  Y  +  Z.  Por  otro  lado,  como  X  ~  iV (60, 81) , 
Y  ~  iV(60, 81)  yZ~  iV(74, 100)  son  v.a.  independientes  entre  sí,  por  la  Proposición  4.2,  tenemos 
que:  W  -  N(  194,262). 

La  probabilidad  de  que  el  peso  total  de  estas  personas  no  supere  la  carga  máxima  del  ascensor 


es: 


P(W  <  250)  =  P 


W  -  194  < 

V262  ~ 


250-  194  \ 

y/262  ) 


=  $(3.46)  =  0.9997 


EJERCICIO  4.1 

Una  compañía  naviera  maneja  contenedores  en  tres  diferentes  tamaños:  Ai  de  27  pies3, 
A2  de  125  pies3  y  A3  de  512  pies3.  Sea  X¡  el  número  de  contenedores  de  tipo  Ai  embarcados 
durante  una  semana  dada,  con  ¿t,  =  E(X¿)  y  of  =  U(X¿),  donde  i  =  1,2,3,  dados  en  la 
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siguiente  tabla: 


Contenedor 

M 

<r2 

Ai 

200 

102 

A2 

250 

122 

A-3 

300 

82 

Suponiendo  que  A'i,  X2  y  A3  son  v.a.  independientes,  calcule  el  valor  esperado  y  la 
varianza  del  volumen  total  embarcado. 


( Sugerencia :  Volumen  =27  x  X\  +  125  x  X2  +  512  x  A3). 


•  ¿Serían  sus  cálculos  necesariamente  correctos  si  las  v.a.  X.¡  no  fueran  independientes? 
Explique. 


2  Se  supone  que  un  comprimido  contiene  500  mg  de  vitamina  C,  pero  en  realidad  ese  contenido 
es  una  variable  aleatoria.  Tenemos  dos  marcas  de  comprimidos,  para  la  marca  A  el  contenido 
de  vitamina  C  tiene  distribución  7V(500,  22)  y  para  la  marca  B  el  contenido  de  vitamina  C 
es  1V(500, 15).  Si  una  persona  durante  una  semana  toma  2  comprimidos  de  la  marca  A  y  5 
de  la  marca  B,  ¿cuál  es  la  probabilidad  de  que,  en  total,  haya  tomado  menos  de  3480  mg  de 
vitamina  C? 


Propagación  de  errores 


En  muchos  casos  interesa  conocer  el  valor  de  una  medición  indirecta,  es  decir,  se  está 
midiendo  x ,  pero  se  desea  conocer  h{x)  y  también  interesa  conocer  cuál  es  el  error  en  la 
medición  indirecta  h( x),  esto  es  lo  que  denominamos  “propagación  de  errores”.  Por  ejemplo, 
sabemos  que  la  absorbancia  a  de  una  solución  es  el  negativo  del  logaritmo  (decimal)  de  su  trans- 
mitancia  t: 


a  =  —  log  t 


Si  la  medición  de  la  transmitancia  es  una  v.a.  X  con  desviación  ax,  entonces  la  absorbancia 
también  es  una  v.a.  Y : 


Y  =  -logX 

Con  estos  elementos  se  desea  calcular  la  desviación  típica  de  Y,  sabiendo  que  E{X)  =  0.501  y  su 
desvío  estándar  es  ax  =  0.001. 

Para  resolver  este  problema,  lo  planteamos  de  modo  más  general:  sea  una  v.a.  Y  que  es 
función  de  varias  variables  Ai,  A2,  . . .,  Xn  independientes  con  medias  ¿¿¿  y  desviaciones  típicas  <r¿, 
Y  =  h(Xi,  X2,  ■  ■  ■  ,Xn),  buscaremos  una  forma  de  aproximar  su  media  y  su  varianza. 
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Recordemos  previamente  la  aproximación  mediante  polinomios  de  Taylor  de  una  función: 
la  función  h{x)  derivable  en  a,  aproximada  con  el  polinomio  de  Taylor  de  grado  1,  en  un  entorno 
de  a  es: 

h{x )  =  h(a)  +  h'(a)(x  —  a ) 

En  caso  de  trabajar  con  una  función  de  varias  variables,  diferenciable  en  (ai,  a2, . . . ,  an),  la 
correspondiente  aproximación  es: 

Oh 

h(x i ,  X2  5  •  •  •  5  3Cri)  —  h{o,  1 ,  &2  5  •  •  •  j  &n)  “t“  ^  ?  •  •  •  >  ^n)  (*^1  ^1 ) 

N  dh  ,  w  , 

"o  (Olí  ^2  ?  •  •  •  ?  )  \%2  ^2  )  *  H-  7^  (^1 5  ^2  5  •  •  •  ?  J  (,*^n  ) 

OX 2  Oxn 

Entonces  trabajando  con  las  v.a.  Xi,  X2,  . . .,  Xn  el  desarrollo  de  Taylor  de  grado  1,  alrededor 
del  punto  (/¿i,  /x2,  ■  ■  • ,  At„),  será: 

Oh 

Y  =  h(X i,X2,  ■  ■  ■  ,Xn )  =  , Un)  +  (Mi,M2,  •  ■  ■  >Mn)(-^": i  —  Mi) 

+  V2,  ■  ■  ■  ,  l¿n)(X2  ~  H2)  4 - h  g^-(lH,H2,..  .,Hn)(Xn  -  Un)  (4.4) 

El  lado  derecho  de  esta  ecuación  es  una  función  lineal  de  las  v.a.  X1;  X2,  . . .,  Xr, .  Si  la 
distribución  conjunta  de  Xi,  X2,  . . .,  X„  está  concentrada  en  una  región  en  la  cual  la 
función  h  sea  aproximadamente  lineal,  entonces  (|4.4D  es  una  buena  aproximación  de  Y.  Por  lo 
tanto,  para  aproximar  los  valores  de  E(Y)  y  dt(Y ),  podemos  utilizar  (14.41)  y  la  Proposición  4.1: 

Oh 

E(Y)  =  E(h(X1,X2,  -  •  -  5  Xn))  =  /i(Mi5M2,  ■  •  ■  >  Mn)  +  (Mi)M2,  •  •  •  j  hn)E(X i  —  /ii) 

Oh 

+  ^2,  ■  ■  ■  ,^n)E(X2  —  fl2)  4 - +  (MliM2,  •  •  •  ,hn)E(Xn  —  Mn) 

Como  E(X.¿  —  hí)  =  0  para  todo  i,  resulta: 

E(h(X i, X2, . . . ,  X„))  =  h(/z i, M2j  •  ■  ■ ,  Mn) 

Del  mismo  modo,  usando  (¡4.41)  y  la  Proposición  4.1,  y  recordando  que  las  v.a.  X¿  son  indepen¬ 
dientes: 

^-(mi,M2,  ■  ■  •  ,Mn)J  war(Xi-/xi) 


ah 


+  ■  ,Mn)  var(X2  —  /x2)  4 - 1-  M2,  ■  •  ■ , Mn)  var(Xn  -  fin) 


ax2 


Como  var(Xi  —  /x¿)  =  var(X¿)  =  af  para  todo  i,  resulta: 


ah 


ax„ 


dh 


ydXl 
Por  último,  como 


ah 


var(Y)^  — —  (/xi,/i2,...,Mn)  crx+  — <t24 - b  c; 


ax 


ah 


ax„ 


rfí(V)  =  dt(h(Xi,X2, . . . ,  X„))  =  >/™w(h(X1,X2)...,Xn)), 


entonces 


dt(y)  9é 


ó  dh 
V dX¡ 


(hl>M2  ,-,Mn) 


u?  4- 


ah 

áx¡ 


(Mi,M2,-..,Mn)  ct24 - h 


ah 

ax: 


(Ml,M2,-.,Mn)  T 
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Ésto  se  resume  en  el  siguiente  resultado: 


PROPOSICIÓN  4.3:  Sean  n  v.a.  independientes  Xi,  X2,  ■  . .,  Xn  con  E(Xi)  =  ¿t-, 
y  dt(Xi)  =  ai.  Si  Y  =  h(Xi,X2,  ■  ■  ■  ,Xn)  para  alguna  función  h ,  diferenciable  en 
(¿¿1 ,/i2, . . .  ,/x„),  entonces: 


Continuando  con  el  ejemplo  de  la  absorbancia  de  una  solución,  tenemos  que  h{x)  =  —  loga;, 
entonces  para  los  x  >  0,  h'(x)  =  —  log  e/x  =  —0.434/a;  (con  e  =  2.71828 . . .),  resulta: 

E(Y)  -  log(0.501)  =  0.30 


y 


dt(Y)  =  (0.434  x  0.001)/0.501  =  0.0009 


Ejemplo  4.3 


Un  péndulo  simple  se  usa  para  medir  la  aceleración  de  la  gravedad,  usando  la  expresión: 

T  =  2n^/L/G 

donde  T  es  el  período  de  tiempo  medido  en  segundos,  L  es  la  longitud  del  péndulo  medida 
en  metros  y  G  es  la  aceleración  de  la  gravedad.  Las  mediciones  fueron  hechas  en  un 
período  de  1.24  seg  y  con  una  longitud  de  0.38  m,  donde  las  desviaciones  fueron 
cr-r  =  0.02  y  aL  =  0.002.  ¿Cuál  es  valor  resultante  de  la  gravedad  calculada  y  su  desviación 
típica? 

Consideramos  las  mediciones  del  período  T  y  la  longitud  L  como  v.a.,  y  tomamos  como 
medias  de  las  mismas  los  resultados  de  esta  medición,  es  decir  ¿¿t  =  1.24seg  y  fj.L  =  0.38 m, 
además  sabemos  que  cft  =  0.02  y  oz,  =  0.002. 

Para  calcular  la  gravedad  a  partir  de  la  expresión  anterior,  nos  queda:  G  =  4ir2L/T 2,  entonces 
el  valor  calculado  de  la  gravedad  es  una  función  de  las  v.a.  longitud  medida  y  período  medido, 
es  decir,  h(L,T)  =  An2L/T2.  Luego 

E(G)  =  /i(0.38, 1.24)  =  4tt20.38/1.242  =  9.7566  m/seg2 

Para  calcular  la  desviación  típica,  tenemos  que: 

f^(L,T)  =  47t2/T2  =►  | y(HL,t*r)  =  4t r2/^  =  4tt2/1.242  =  25.6753 
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y 


—  (L,T)  =-Sn2L/T  =►  —  (/í¿,  mt)  =  -Sn2gL/gT  =  -8tt20.38/1.24  =  -24.1964 

entonces: 

var{G)  =  25.67532  x  0.0022  +  (-24.1964)2  x  0.022  =  0.2368 
dt(G)  =  \/0.2368  =  0.4866  m/seg 2 


EJERCICIO  4.2 

Se  desea  calcular  el  volumen  de  un  tanque  cilindrico,  se  mide  el  diámetro  de  la  base  ( d )  y 
la  altura  (h).  Existen  errores  de  medición,  por  ese  motivo  los  resultados  obtenidos  se 
consideran  variables  aleatorias  con  =  0.10  m  y  <7h  =  0.06  m.  Consideramos  los  valores  me¬ 
didos  d  =  4.50  m  y  h  =  1.80  m  como  las  respectivas  medias.  Hallar  la  desviación  estándar  del 
volumen  calculado. 


Muestra  aleatoria 

Cuando  se  realizan  mediciones  repetidas  (con  error  aleatorio)  de  una  magnitud,  los  resultados  de 
cada  medición  pueden  ser  representados  por  las  v.a.  Xi,  X2,  . . .,  Xni  que  se  suponen  independientes 
con  la  misma  distribución,  y  por  consiguiente  con  la  misma  media  fj,  y  la  misma  desviación  típica 
a.  En  ese  caso,  la  media  /i  es  la  verdadera  magnitud  que  deseamos  medir  y  la  desviación  a  depende 
de  la  precisión  del  método  de  medición. 

Cuando  se  eligen  al  azar  n  individuos  de  una  población  y  se  mide  determinada  característica  de 
esos  individuos  (por  ejemplo  su  nivel  de  hemoglobina),  los  resultados  de  esas  mediciones  también 
son  variables  aleatorias  X\ ,  X2,  ■  ■ .,  Xn,  independientes  y  con  la  misma  distribución.  En  este  caso 
/i  y  a  son  la  media  y  la  desviación  típica,  respectivamente,  de  la  distribución  de  esa  característica 
en  la  población. 

Definición: 

Un  conjunto  de  v.a.  independientes  y  con  la  misma  distribución  se  llama  muestra  aleatoria 

de  esa  distribución. 


Notación 

En  general  abreviaremos  muestra  aleatoria  como  m.a. 
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Definición: 


Dada  una  m.a.  X\,  X2,  ■  . .,  Xn,  se  define  la  media  muestral  o  promedio  muestral  como: 


_  1  n 

x  =  -J2x* 

n  ¿ ' 


Observación: 

La  media  muestral  es  un  caso  particular  de  una  combinación  lineal  donde 
a¿  =  1/n  para  todo  i.  Entonces,  si  Xi,  X2,  . . .,  Xn  es  una  muestra  aleatoria 
con  E(Xi)  =/¿y  var(Xi)  =  a 2,  aplicando  la  Proposición  4.1,  la  media  muestral 
es  una  v.a.  que  cumple: 

E{X)  =  ¿  ¿,  var(X)  =  a 2  ¡n  y  dt(X)  =  a/yfñ  (4.5) 


A  partir  de  (14.51)  también  se  deduce  que  promediar  varias  mediciones  aumenta  la  precisión,  es 
decir,  a  mayor  número  de  mediciones  es  mejor  la  precisión  pues  disminuye  el  desvío  de  X .  Si  se 
tienen,  por  ejemplo,  n  =  10  mediciones  y  se  desea  duplicar  la  precisión  o  sea,  reducir  dt{X)  a  la 
mitad  hace  falta  tomar  n  =  40  (y  no  n  =  20). 


Ejemplo  4.4 


Se  van  a  realizar  una  serie  de  mediciones  con  un  método  que  tiene  un  error  de  medición  con 
a  =  0.5.  ¿Cuántas  mediciones  se  deben  realizar  si  se  desea  que  la  desviación  típica  de  la  media 
muestral  sea  a  lo  sumo  0.2? 

Los  resultados  de  las  n  mediciones  son  una  m.a.  X±,  X2,  . . .,  Xn  y  sabemos  que 
dt(X)  =  0.5/v^  <  0.2.  De  allí  se  deduce  que  n  >  2.52  =  6.25,  y  por  lo  tanto  es  necesario 
hacer  por  lo  menos  7  mediciones. 


EJERCICIO  4.3 

Considere  el  experimento  de  arrojar  un  dado  equilibrado  y  observar  el  número  de  veces  que  sale 
el  2.  Realice  este  experimento  para  poder  calcular  la  media  muestral  y  el  desvío  de  la  media 
muestral  en  cada  uno  de  los  siguientes  casos: 

si  se  arroja  el  dado  5  veces 

•  si  se  arroja  el  dado  15  veces 

•  si  se  arroja  el  dado  30  veces 
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Distribución  de  X 


Como  ya  se  mencionó,  X  es  una  variable  aleatoria  y  su  distribución  depende  de  la  distribución 
de  las  X\ .  A'2,  . . Xn.  En  muchos  casos  conocer  la  forma  de  esta  distribución  no  es  simple,  aunque 
siempre  sabemos  que  la  media  de  X  es  la  misma  que  la  de  las  A.¿  y  la  desviación  típica  de  X  es  la 
misma  de  las  A¿  dividida  por  yfñ. 

Sin  embargo,  hay  una  situación  particular  en  que  la  distribución  de  A'  es  sencilla,  según  la 
Proposición  4.2,  cuando  la  m.a.  A'i,  A2,  . ..,  Xn  tiene  distribución  normal  N{n,a2),  X  tiene 
distribución  N(/j,,a2 /n). 

Ahora  bien,  si  la  distribución  de  las  Ai,  X2, . . .,  Xn  no  es  normal,  en  general  es  difícil  determinar 
la  distribución  de  X.  Pero  el  siguiente  resultado  es  de  gran  ayuda  para  poder  aproximarla  cuando 
podemos  contar  con  una  muestra  suficientemente  grande. 


TEOREMA  CENTRAL  DEL  LÍMITE  (TCL):  Sean  n  v.a.,  Xu  X2,  . . .,  Xn  indepen¬ 
dientes  entre  sí  y  con  la  misma  distribución,  con  media  fi  y  desviación  típica  a.  Entonces  si 
n  es  grande,  X  tiene  aproximadamente  una  distribución  normal  con  media  /i  y  desviación 

n 

típica  a /  y/ñ.  Del  mismo  modo  A¿  también  tiene  distribución  aproximadamente  normal 

i- 1 

con  media  rifi  y  desviación  típica  -/ña. 

Formalmente 


P(X  <a)  =  P 


(X-ñ^ 

\a/y/ñ 


a- 

v/>/ñ) 


a  ~  l-í  \ 
a/y/ñ) 


P 


^A,<a  =P 


Z)r=i Xi-nn  a-  n/i 


y/ñc 


< 


y/ñ0 


=  <!> 


a  —  nfi 


y/ña 


Este  teorema  nos  dice  que  cualquiera  sea  la  distribución  de  la  m.a.,  Ai,  A2,  . . .,  Xn,  podemos 

n 

calcular  (al  menos  en  forma  aproximada)  probabilidades  de  eventos  relacionados  con  A¿,  o  con 

_  i=1 
A,  siempre  que  n  sea  suficientemente  grande.  Como  regla  práctica,  podemos  decir  que  con  n  >  30 

se  consigue  una  aproximación  aceptable. 

Notación 

Si  A  tiene  aproximadamente  una  distribución  normal  con  media  /i  y  desviación  típica  a / y/ñ,  lo 
abreviaremos,  X  r¿  N(/j,,a2 /n). 

n 

Si  Xi  también  tiene  distribución  aproximadamente  normal  con  media  n/i  y  desviación  típica 

i= 1 

n 

y/ña,  lo  abreviaremos,  A'¿  w  N{n^i,na2). 

»= 1 
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Ejemplo  4.5 


Supongamos  que  el  consumo  diario  de  calorías  de  una  persona  es  una  v.a.  con  media  p  =  3000 
y  desviación  típica  a  =  350.  ¿Cuál  es  la  probabilidad  de  que  el  consumo  promedio  de  calorías 
diarias  en  el  próximo  año  esté  entre  2950  y  3050? 

Los  consumos  diarios  de  cada  uno  de  los  días  del  próximo  año,  los  podemos  representar  con  las 
v.a.  Xi,  X2 ,  . . .,  -Y365,  que  podemos  suponer  independientes  y  todas  tienen  la  misma  distribución 
desconocida  con  media  3000  y  desviación  típica  350.  Nos  interesa  calcular  la  probabilidad  de  que 
el  promedio  de  esas  365  v.a.  esté  entre  2950  y  3050,  esto  es: 


P(2950  <  X  <  3050)  =  P 
=  $ 


/ 2950—3000  ^  X  —  3000  ^  3050-3000  \ 

V  “  SSO/v^  “  350/-/365  J 

í  3050  -  3000  \  /  2950  -  3000  \ 

V  350/\/365  )  V  350/ a/365  ) 


(estandarizando) 


(por  TCL,  pues  n  >  30) 


=  $(2.73)  -  $(-2.73)  =  2$(2.73)  -  1 


(por  simetría  de  cp) 


=  2  x  0.9968  -  1  =  0.9936 


(por  Tabla) 


Aplicaciones  particulares  del  Teorema  Central  del  Límite 


1  La  distribución  binomial,  cuando  n  es  grande,  se  puede  aproximar  a  una  normal  con  media 
np  y  varianza  np(  1  —  p).  Entonces  si  X  ~  B(n,p)  se  cumple: 


P(X  <x)  =  P 


X  —  np  x  —  np 


■s/np(l-p)  \/np{l  -p)/ 
Esta  aproximación  es  aceptable  cuando  np(  1  —  p)  >  5. 


=  $ 


x  —  np 
^np(l-p) 


Notación 

Si  X  ~  B(n,p),  donde  el  valor  de  n  es  grande  y  np(  1  —  p)  >  5,  entonces  escribiremos 
X  «  N (np,  np(  1  —  p)) . 


Ejemplo  4.6 


La  primer  tarea  en  un  curso  introductorio  de  programación  por  computadora  implica  correr  un 
breve  programa.  Si  la  experiencia  indica  que  5  %  de  los  estudiantes  avanzados  no  cometen  errores 
de  programación,  calcule  la  probabilidad  de  que  en  un  grupo  de  150  estudiantes  que  trabajan 
individualmente,  menos  de  3  alumnos  no  comentan  errores. 

Definimos  la  v.a.  X  como  el  número  de  alumnos,  entre  150,  que  no  cometen  errores  de 
programación,  X  ~  P(150,  0.05),  como  n  es  grande  y  np(  1  —  p)  =  150  x  0.05  x  0.95  =  7.125  >  5 


85 


podemos  aplicar  el  TCL: 


P(X  <  3)  =  P[X  <2  )=P\  X  UP  <  2  UP  )  £*  $(-2.06)  =  0.0197 

\^/np(l-p)  y/np{\-p)J 

Observar  que  el  valor  exacto  es  P(X  <  3)  =  F( 2)  =  0.01815406.  Gráficamente  tenemos: 


2  La  distribución  de  Poisson,  cuando  A  es  grande,  se  puede  aproximar  a  una  normal  con  media 
A  y  varianza  A.  Entonces  si  X  ~  P( A)  se  cumple: 


P(X  <x)  =  P 


X  —  A  x  —  A 
a/A 


^  $ 


x  —  X 


Esta  aproximación  es  aceptable  cuando  A  >  30. 


Notación 

Si  X  ~  P(A),  donde  el  valor  de  A  es  grande,  entonces  escribiremos  X  ss  iV(A,  A) 


Ejemplo  4.7 


El  número  de  personas  que  entran,  en  un  día,  al  puesto  de  periódicos  a  comprar  una  revista  es 
una  v.a.  con  distribución  Poisson  con  A  =  32.  Encuentre  la  probabilidad  de  que  a  lo  sumo  22 
personas,  en  un  día,  entren  al  puesto  de  periódicos  a  comprar  una  revista. 

Sea  X  el  número  de  personas  que  entran  a  comprar  una  revista,  entonces  X  ~  P( 32)  y  como 
A  es  grande,  podemos  aplicar  el  TCL: 

(X  —  X  22  —  A  A 

— j=-  <  \  =  $(-1.77)  =  0.0384 

Observar  que  el  valor  exacto  es  P(X  <  22)  =  P(22)  =  0.04062094.  Gráficamente  tenemos: 
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EJERCICIO  4.4 


1  El  contenido  de  nicotina  de  un  cigarrillo  de  una  marca  en  particular  es  una  v.a.  con  media 
0.8  mg  y  desviación  estándar  0.1  mg.  Si  un  individuo  fuma  5  paquetes  de  20  de  estos  cigarrillos 
por  semana,  ¿cuál  es  la  probabilidad  de  que  la  cantidad  total  de  nicotina  consumida  en  una 
semana  sea  por  lo  menos  de  82  mgl 

2  El  número  de  colonias  de  bacterias  de  cierto  tipo  en  una  muestra  de  agua  contaminada,  tiene 
una  distribución  de  Poisson  con  una  media  de  2  colonias  por  cm3.  ¿Cuál  es  la  probabilidad 
de  que  en  una  muestra  de  100  cm3  haya  más  de  210  colonias? 

3  Una  línea  aérea  sabe  que,  en  general,  el  5  %  de  las  personas  que  hacen  sus  reservaciones 
para  cierto  vuelo  no  se  presentan.  Si  la  aerolínea  vende  160  boletos  para  un  vuelo  que  tiene 
155  lugares  disponibles,  ¿cuál  es  la  probabilidad  de  que  haya  lugar  disponible  para  todos  los 
pasajeros  que  se  presentan  en  el  momento  del  vuelo? 
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CAPITULO  5 


Estimación 


Introducción 


El  objetivo  de  la  Estadística  es  hacer  inferencias  con  respecto  a  una  población,  basándose  en 
la  información  contenida  en  una  muestra.  Generalmente  las  distribuciones  poblacionales  dependen 
de  ciertos  parámetros.  Por  ejemplo  en  los  Capítulos  [2]  y  [3]  estudiamos  algunas  distribuciones 
poblacionales  discretas,  como  Binomial  y  Poisson,  o  continuas,  como  Exponencial,  Uniforme  y 
Normal.  Cada  una  de  ellas  es  descrita  mediante  uno  o  más  parámetros,  en  la  Binomial  el  parámetro 
p  representa  la  probabilidad  de  éxito,  en  la  Normal  el  parámetro  /i  es  la  esperanza  o  media  de  la 
población,  mientras  a2  es  la  varianza,  y  nos  da  una  idea  de  la  dispersión  de  los  valores  poblacionales 
respecto  de  /x,  etc.  Conociendo  el  valor  de  esos  parámetros  aprendimos  a  calcular  cuán  probables 
podrían  ser  ciertos  resultados  en  la  población.  Sin  embargo,  en  una  situación  real,  esos  parámetros 
poblacionales  son  desconocidos. 

En  este  capítulo  veremos  cómo  utilizar  los  valores  de  una  muestra  para  obtener  información 
sobre  el  valor  de  un  parámetro  poblacional.  Veremos  algunas  propiedades  de  las  funciones  que  suelen 
utilizarse  para  calcular  estimaciones  puntuales  de  los  parámetros  desconocidos  y  estudiaremos 
procedimientos  para  obtener  estimaciones  mediante  intervalos  de  confianza. 
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Estimación  puntual 


El  objetivo  de  la  estimación  puntual  es,  usando  los  datos  muéstrales,  seleccionar  un  solo  número 
que  sea,  en  algún  sentido,  una  buena  presunción  del  valor  del  parámetro  que  se  desea  conocer. 

Supongamos,  por  ejemplo,  que  el  parámetro  de  interés  es  el  valor  medio  de  duración  de  baterías 
de  cierto  tipo  para  una  calculadora.  Una  muestra  aleatoria  de  5  baterías  podría  dar  duraciones 
observadas,  en  horas,  de:  X\  =  5,  X2  =  6.4,  x3  =  5.9,  X4  =  5.3  y  15  =  5.7.  El  valor  calculado 
de  la  duración  media  muestral  es  x  =  5.66,  es  razonable  considerar  el  valor  5.66  como  una  buena 
presunción  del  verdadero  valor  de  la  media  poblacional. 

Al  analizar  conceptos  generales  y  métodos  de  inferencia,  usaremos  la  letra  griega  9  para  indicar 
el  parámetro  de  interés. 

Veremos  algunas  definiciones  básicas. 

Primero  recordemos  que  una  muestra  aleatoria  es  un  conjunto  de  v.a.  X-¡ ,  X2. ....  Xn 
independientes  y  todas  con  la  misma  distribución.  Los  valores  observados  de  esa  m.a.  son  números 
Xl ,  X2 ,  ■  •  • ,  xn . 

Definición: 

Sean  Xi,  X2l . . . ,  Xn  una  m.a.,  llamamos  estadístico  a  cualquier  función  de  la  m.a. 

Entonces,  un  estadístico  es  también  una  v.a. 


Definición: 

Si  X-¡ ,  X'2, . . . ,  Xn  es  una  m.a.  de  una  distribución  que  depende  de  un  parámetro  9 ,  un 
estimador  puntual  de  9  es  un  estadístico  /i(X1,X2,  . . .  ,Xn),  que  se  utiliza  para  estimar 
el  valor  desconocido  de  ese  parámetro,  de  modo  que,  un  estimador  es  una  v.a.  Cuando 
esa  función  se  aplica  a  los  valores  observados  de  la  m.a.,  h(x i,x2,  ■  ■  ■  ,xn),  constituye  una 

estimación  puntual,  que  es  un  número. 


Notación 

En  general  al  estimador  de  9  lo  denotamos  9 ,  también  a  su  estimación. 


Ejemplo  5.1 


En  el  ejemplo  anterior,  el  estimador  puntual  de  la  media  verdadera  de  la  duración  de  las  baterías 
es  X  =  (Xi  +  X2  +  X3  +  X4  +  X5)/5,  y  el  valor  calculado  para  los  valores  muéstrales,  5.66,  es 
la  estimación  puntual. 
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Algunos  estimadores  básicos 


Si  tenemos  una  m.a.  X-¡ .  X2, ....  Xn  de  cualquier  distribución  que  sabemos  que  tiene  me¬ 
dia  /x,  el  estimador  usual  para  este  parámetro  es  la  media  muestral  X ,  que  ya  definimos 
anteriormente. 

2.  Si  tenemos  una  m.a.  X±,X2,  ■  ■  ■ ,  Xn,  de  una  distribución  continua  desconocida,  sabemos  que 
para  cualquier  distribución  existe  la  mediana  Jj,.  Vamos  a  ver  cómo  estimar  Jl. 

Definición: 

Dados  los  valores  observados  x±,X2,  ■  ■  ■ , xn  de  una  m.a.  Llamamos  x^\  a  los  ordenados: 

•£(1)  ^  *£(2)  —  '  ‘  ‘  —  x(n) 

La  mediana  muestral,  que  denotaremos  como  med{ X\,X2,  ■  ■  ■  ,xn)  =  x,  es  el  valor  que 
verifica  que  la  mitad  de  las  observaciones  son  menores  a  x  y  la  mitad  de  las  observaciones 
son  mayores  a  x.  La  mediana  muestral  es  una  estimación  de  la  mediana  poblacional  Jí. 

En  la  práctica,  la  mediana  se  calcula  de  la  siguiente  manera: 

•  si  n  es  impar,  entonces  x  =  X(m)  con  m  =  (n  +  1)/ 2 

~  x(m)  +  x(m+ 1)  /r) 

si  n  es  par,  entonces  x  =  - - -  con  m  =  n/  2 


Ejemplo  5.2 


Consideremos  las  siguientes  20  observaciones,  cada  una  representa  la  duración  (en  horas)  de  un 
cierto  tipo  de  lámpara  incandescente: 

1088  666  1016  964  1058  612  1003  898  1197  1022 

744  1135  623  1085  970  1201  983  1029  883  1122 

Para  calcular  la  mediana  debemos  ordenar  las  observaciones  de  menor  a  mayor: 


612  623  666  744  883  898  964  970  983  1003 

1016  1022  1029  1058  1085  1088  1122  1135  1197  1201 

Como  en  este  caso  tenemos  20  observaciones,  la  mediana  será  el  promedio  de  las  dos  centrales: 

Z(io)  +  x(n)  =  1003  +  1016  =  1009.5 
2  2 


3  Si  tenemos  una  m.a.  Vi,  X2, . . . ,  Xn  de  cualquier  distribución  que  tiene  media  /i  y  varianza 
cr2,  el  estimador  usual  para  la  varianza  es  la  varianza  muestral,  que  llamaremos  S2\ 

s2  =  ¿t¿<x'-x>2 

2—1 
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Ejemplo  5.3 


Recordemos  el  ejemplo  de  las  5  baterías,  donde  las  duraciones  observadas,  en  horas,  son:  x\  =  5, 
X2  =  6.4,  X3  =  5.9,  X\  =  5.3  y  15  =  5.7.  Si  calculamos  la  varianza  muestral,  se  tiene  que 
S2  =  0.293. 

I 

4.  Si  A'  ~  B(n,p)  un  posible  estimador  de  p  es  p  =  X/n. 


Ejemplo  5.4 


Se  desea  evaluar  la  efectividad  de  un  nuevo  medicamento  contra  una  enfermedad.  Se  administró 
el  medicamento  a  150  personas  que  padecían  dicha  enfermedad  y  se  observó  que  114  personas 
se  recuperaron  a  los  3  días.  Estime  la  proporción  de  individuos  que  se  recuperan  dentro  de  los 
tres  días  de  administrado  el  medicamento. 

En  este  ejemplo  tenemos,  X  =  “número  de  individuos  que  se  recuperan  dentro  de  los  tres  días 
de  administrado  el  medicamento,  entre  150”  donde  X  ~  R(150, p).  Queremos  estimar  p,  para 
ello  tenemos  que  x  =  114  y  n  =  150,  entonces  p  —  ^  =  0.76. 


Algunas  propiedades 

Si  queremos  estimar  un  parámetro,  no  parece  razonable  elegir  cualquier  función  de  la  muestra. 
En  general  pediremos  que  el  estimador  tenga  algunas  propiedades. 

Definición: 

Si  9  es  un  estimador  de  9,  se  llama  sesgo  del  estimador  a  la  diferencia  E(9)  —  9. 

Se  dice  que  el  estimador  9  es  insesgado,  si  E{9)  =  9 ,  para  cualquier  valor  de  9. 


Ejemplo  5.5 


Dada  una  m.a.  de  una  distribución  con  media  p,  ya  vimos  que  E{ X)  =  p,  luego  A'  es  un 
estimador  insesgado  de  la  media  poblacional  p. 


Ejemplo  5.6 


Dada  una  m.a.  de  una  distribución  con  media  p  y  varianza  a2,  la  varianza  muestral  es  un 
estimador  insesgado  de  la  varianza  poblacional  a2,  esto  significa  que  E(S2)  =  a2. 
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Para  probar  esta  propiedad,  desarrollamos  el  cuadrado: 


J2(x^  ~X)2  =  J2  (Xi  ~  2X-X  +  x2)  =  1]  xi  ~  2X  ^2Xi  +  nX~ 

2=1  2=1  2=1  2=1 

n  n  n 

=  ^  X2  —  2 XnX  +  nX2  =  ^  Xf  —  2nX2  +  nX 2  (ya  que  ^  Xi:  =  nX) 

2=1  2=1  2=1 

n 

=  YJx¡-nX2 
2=1 


Luego,  aplicando  las  propiedades  de  la  esperanza: 

E (S2)  =  fe  E(Xf)  -  nE(X2)j  =  ÍÉ  (°*  +  ^  ~  "  (£  +  ^))  <51) 

= - j  (n(0’2  +  A¿2)  ct2  ~  n^2)  =  — — j  ^n<r2  +  —a2  — 

=  ¿í  ^r) = »2 


_ 2 

En  (15.11)  se  utilizo  para  el  cálculo  de  E(X~)  y  E(X  )  que  para  cualquier  v.a.  Y  tenemos  que 
E{Y2)  =  var(Y)  +  ( E(Y ))2  (por  la  Propiedad [2] 3). 


Ejemplo  5.7 


Si  .Y  ~  B(n,p ),  p  =  X/n  es  un  estimador  insesgado  para  p,  ya  que: 


E{p)  =  E 


~  E{X)  =  L  XP  =  V 
n  X 


Ejemplo  5.8 


Supongamos  que  el  tiempo  de  espera  para  tomar  un  colectivo  tiene  una  distribución  uniforme 
en  el  intervalo  de  tiempo  [0,  9}  donde  8  es  desconocido.  Se  desea  estimar  al  parámetro  8  en  base 
a  los  siguientes  tiempos  que  tiene  que  esperar  una  persona  durante  10  días: 

4.5  6.3  3.1  1.1  8.9  2.4  0.6  7.3  5.7  9.2 

Estos  son  los  valores  observados  de  una  muestra  aleatoria  X-¡ .  X'¿. . . . ,  Xn  de  una  distribución 

U[0,8\. 

Como  el  valor  de  9  es  el  máximo  tiempo  de  espera  posible,  parece  razonable  elegir  como 
estimador  de  9 ,  al  máximo  de  los  tiempos  de  espera  de  la  muestra,  esto  se  escribe: 

9  =  máx(Xi,  JY2, . . . ,  Xn). 

Se  puede  demostrar  (pero  escapa  al  alcance  de  este  curso)  que: 

E(9)  =  9,  (5.2) 
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esto  significa  que,  9  no  es  un  estimador  insesgado  para  9,  sin  embargo,  a  partir  del  mismo,  se 
puede  obtener  un  estimador  insesgado.  Definimos  a  este  nuevo  estimador  como: 


zs  77,  1 

9\  = - máx(Xi,X2, . . .  ,Xn), 

n 

este  estimador  es  insesgado,  ya  que: 

E{9{)  =  E  f  ^  máx(X!,X2,  ■ .  máx(X1,X2, . . .  ,Xn)) 

\  n  J  n 

=  ’t±±E(0)'9p*  J/,C( 

n  /n  xd  1 

Por  otro  lado,  recordando  que  la  esperanza  de  una  v.a.  con  distribución  uniforme  es  el  punto 
medio  del  intervalo,  en  este  caso  9/ 2,  se  podría  definir  otro  estimador  para  9  como: 


02  =  2X 


Este  estimador  también  es  insesgado,  ya  que: 

E(62)  =  E(2X)  =2  E(X)  =  20/2  =  9 

Luego,  los  valores  de  la  estimación  obtenida  para  el  primer  estimador,  9 1,  es 
”  máx(xi,X2,  •  •  ■ ,  xn)  =  x  9.2  =  10.12.  Y  para  el  segundo  92  es  2x  =  2  x  4.91  =  9.82. 


Si  tenemos  más  de  un  estimador  insesgado,  ¿cuál  será  el  mejor?  Dada  esta  situación  es  conve¬ 
niente  elegir  el  que  tiene  menor  varianza. 


Ejemplo  5.9 


Continuando  con  el  ejemplo  anterior,  veamos  cual  de  los  dos  estimadores  del  parámetro  9  es  el 
mejor.  Primero  calculemos  las  varianzas  de  ambos  estimadores: 

2 


var{9i)  =  var 


n  +  1 


n 


máx(Xi,X2, . .  .,Xn)  )  = 
n9 2 


n  +  1 


n 


^  var{  máx(Xi,  X2, ...  ,Xn)) 


n2  +  2)  n(n  +  2) 

^  _  _  q2  /i  o  ^2 

var(92)  =  var(2X )  =  4  var(X')  =  4 -  =  — 

77,  077, 


(5.3) 


En  (15.31)  se  utilizó  que: 

n92 

var(  máx(X1,X2,...,Xn))  =  - — — 

7  [n  +  l)2(n  +  2) 

la  demostración  de  esta  igualdad  escapa  al  alcance  de  este  libro. 

Por  último,  como  n{n  +  2)  >  3n  vale  para  todo  n  >  O,  tenemos  que:  uar(9 1)  <  var(92).  Por 
lo  tanto,  el  mejor  estimador  para  el  parámetro  9,  del  Ejemplo  5.8,  es  9\. 


93 
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Observación: 

Si  alguno  de  los  estimadores  no  es  insesgado  existen  otros  criterios  para  decidir 
cuál  es  el  mejor.  Pero  esto  no  se  tratará  en  este  curso. 


Definición: 


Se  denomina  error  estándar  de  un  estimador  a  su  desviación  estándar,  es  decir, 
dt(9)  =  \J  var(9). 


Transformaciones  del  parámetro 


Si  9  es  un  estimador  de  9 ,  y  queremos  estimar  por  ejemplo  9 3,  es  decir,  queremos  9 3,  parecería 
razonable  usar  como  estimador  (0)3 .  En  general  cuando  queremos  estimar  una  función  continua 
h{9 ),  usaremos  como  estimador  h(9). 

Por  ejemplo,  en  la  fórmula  del  error  estándar  puede  haber  parámetros  desconocidos  cuyos 
valores  se  pueden  estimar,  al  sustituir  dichos  parámetros  por  sus  estimadores,  se  obtiene  el  error 
estándar  estimado  del  estimador,  se  suele  denotar  con  dt(9). 


Ejemplo  5.10 


Si  X  ~  B(n,p)  ya  vimos  que  p  =  X/n  es  un  estimador  del  parámetro  p ,  su  error  estándar  es 
dt(p)  =  y/var(X/n)  =  y/p(l-p)/  n.  Además,  su  error  estándar  estimado  es: 


p(l-p) 


Ejemplo  5.11 


Sea  Xi,X2, . . .  ,Xn  una  m.a.  de  una  distribución  con  media  /i  y  varianza  o2.  Ya  vimos  que  X 
es  un  estimador  de  p,,  el  error  estándar  de  A'  es  dt( X)  =  a / y/ñ  y  el  error  estándar  estimado  de 
X  es  S/y/ñ. 
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EJERCICIO  5.1 


1  Se  analizaron  doce  muestras  de  cierta  marca  de  pan  blanco  (A)  y  se  determinó  el  contenido 
de  carbohidratos  (expresado  en  porcentaje),  obteniéndose  los  siguientes  valores: 

76.93  76.88  77.07  76.68  76.39  75.09 

76.88  77.67  78.15  76.50  77.16  76.42 

Estime  la  media,  la  mediana  y  el  desvío  estándar  del  contenido  de  carbohidratos  para  esta 
marca. 

2  Se  supone  que  el  tiempo  de  vida  (en  horas)  de  un  tipo  de  lámpara  tiene  distribución  ex¬ 
ponencial.  Se  prueban  10  lámparas  de  ese  tipo  y  se  observa  que  los  tiempos  de  vida  de  las 
mismas  son: 


7.5  28.2  47.4  17.2  8.5  60.1  21.3  29.5  2.7  5.5 


Estime  el  parámetro  A  de  la  distribución  y  la  probabilidad  de  que  una  lámpara  de  ese  tipo 
dure  más  de  50  horas. 


3  Sea  Xi,  X2,  ■  ■ .,  Xn  una  muestra  aleatoria  de  una  distribución  con  media  g  y  varianza  a2 . 
Considere  los  siguientes  3  estimadores  para  ¿ 1 : 


X\  +  X2  ^  _  X\  X2  + ...  +  Xn_i 
2  ’  ^  ~4~  +  2(n-  2) 


y  £3  =  X 


Demostrar  que  los  tres  estimadores  son  insesgados  para  g. 
Calcular  sus  varianzas  y  compararlas.  ¿Cuál  es  el  mejor? 


Intervalos  de  confianza 

En  los  ejemplos  anteriores,  hemos  estimado  un  parámetro  que  puede  tomar  cualquier  valor 
dentro  de  un  intervalo  real,  pero  sabemos  que  es  prácticamente  imposible  que  nuestra  estimación 
sea  exactamente  igual  al  parámetro  que  deseamos  estimar.  Por  ese  motivo,  para  dar  una  idea  de 
la  precisión  de  la  estimación,  se  busca  dar  una  estimación  mediante  un  intervalo  de  confianza. 

Definición: 

Sea  X±,  X2, . . . ,  Xn  una  m.a.  de  una  distribución  F{9).  Un  intervalo  de  confianza  de  nivel 
(1  —  a),  o  intervalo  de  100(1  —  a)  %  de  confianza,  es  un  intervalo  de  extremos  aleatorios, 
gi(Xi,  X2, . . . ,  Xn)  (extremo  inferior)  y  g2(Xi,X2, . . . ,  Xn)  (extremo  superior),  que  contiene 
al  parámetro  9 ,  con  probabilidad  1  —  a,  esto  quiere  decir  que: 

p(g1(X1,X2,...,Xn)<9<g2(X1,X2,---  ,*„))  =  l-a 
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Notación 


Al  intervalo  de  confianza  que  contiene  al  parámetro  6 ,  con  probabilidad  1  —  a,  lo  denotaremos 
como  IC(i-a)(9). 


Observación: 

Es  deseable  que  el  nivel  de  confianza  sea  lo  mayor  posible.  Generalmente  se 
utilizan  los  niveles  0.95  ó  0.99. 


¿Cómo  construimos  un  IC? 

Los  pasos  a  seguir  son: 

Paso  1  Se  busca  una  función  de  la  m.a.  y  del  parámetro  de  interés,  que  llamaremos  función 
pivote,  cuya  distribución  no  dependa  de  ningún  parámetro  desconocido  y  que  en  su 
expresión  el  único  valor  desconocido  sea  el  parámetro  de  interés.  Denotaremos  a  la  función 
pivote  como  h(X-¡ ,  X2, . . . ,  Xn,  9). 

Paso  2.  Determinar  un  par  de  números  reales  a  y  b,  tales  que: 

p(a<h(X1,X2,...,Xn,0)<b)  =  l-a  (5.4) 

Paso  3.  Siempre  que  sea  posible,  a  partir  de  (15. 41).  despejar  los  extremos  aleatorios,  finalmente 
obtendremos  el  intervalo  deseado: 

IC{1_a)(9)  =  [g1(X1,X2, . . . ,  Xn),g2(X1,X2, . . . ,  X„)) 

Veamos  como  se  aplican  estos  pasos  con  un  ejemplo. 


Ejemplo  5.12 


Consideremos  la  distribución  de  los  niveles  de  colesterol  en  sangre  de  los  hombres  de  cierta 
comunidad,  hipertensos  y  fumadores.  Se  sabe  que  esta  distribución  es  aproximadamente  normal, 
se  desconoce  su  media  g,  pero  se  sabe  que  su  desviación  típica  er  =  46  mg/ 100  mi,  (aunque  no 
se  conoce  g  se  supone  que  a  es  la  misma  que  la  de  la  población  de  adultos  de  sexo  masculino  de 
esa  comunidad).  Se  desea  conocer  el  nivel  medio  de  colesterol  en  sangre  de  este  grupo,  entonces 
se  seleccionan  12  hombres  hipertensos  y  fumadores  y  se  determina  el  nivel  de  colesterol  para 
cada  uno.  El  nivel  de  colesterol  en  sangre  (medido  en  mg/ 100  mi)  para  cada  individuo  es  una 
v.a.  Xi  que  tiene  distribución  normal  con  media  g  (el  valor  que  se  desea  conocer)  y  el  a  antes 
mencionado. 
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Cuando  se  promedian  los  12  valores  observados,  se  obtiene  un  x  =  217  mg/ 100  mi.  Notar 
que  g,  es  la  media  “verdadera”  desconocida  de  las  observaciones  X¿,  mientras  que  x  es  la  media 
de  la  muestra.  Este  valor  es  una  estimación  de  g. 

En  este  caso  elegimos  1  —  a  =  0.95. 

Paso  1.  Como  las  Xt  son  una  m.a.  de  una  cr2),  la  función 

Z  =  h(X1,X2,...,Xn,f¿)  = 

a/y/n 

que  tiene  distribución  N( 0, 1),  será  nuestra  función  pivote. 

Paso  2.  Para  buscar  los  valores  de  a  y  b  que  verifiquen  (|5.4[).  debemos  notar  que  la  función 
pivote  tiene  distribución  normal  estándar,  entonces  gráficamente  tenemos  que: 


Buscando  en  la  Tabla,  vemos  que  $(—1.96)  =  0.025  entonces  en  este  ejemplo  a  =  —1.96 
y  b  =  1.96.  Por  lo  tanto,  tenemos  que: 

P  f -1.96  <  <  1.96 )  =  0.95 

V  °7V™  / 

Paso  3.  Despejando  /i  en  la  desigualdad  de  la  probabilidad  anterior,  obtenemos: 

P[X-  1.96  x^<M<X+  1.96  x  4=  )  =  0.95, 

V  Vn  vV 


quiere  decir  que  el  intervalo  obtenido  es: 

IC( 0.95) (M)=  (x-1.96x  “  ,X  +  1.96x 

V  vn  Vn 


o 


(5.5) 


Este  intervalo  de  extremos  aleatorios  contiene  al  verdadero  valor  del  parámetro  /i  con  probabili¬ 
dad  0.95,  dicho  de  otro  modo,  es  un  intervalo  de  95  %  de  confianza  para  /u.  El  intervalo  aleatorio, 

se  puede  abreviar  como  IC( o.95)(m)  =  X  ±  1.96  x  -^=. 

y/n 

Utilizando  los  valores  del  ejemplo  y  reemplazando  X  por  x  =  217,  obtenemos: 


46  46  \ 

217  -  1.96  x  -=  ,  217  +  1.96  x  -=  =  (191, 243) 

V12  v  12  / 
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Notación 


Sea  Z  ~  N( 0, 1)  y  sea  a  un  número  real  entre  0  y  1,  se  define  el  valor  crítico,  za,  como  el  valor 
tal  que  P(Z  >  za )  =  a.  Informalmente,  es  el  punto  sobre  el  eje  x  que  verifica  que  el  área  a  su 
derecha,  bajo  la  curva  de  densidad,  es  igual  a  a.  Gráficamente: 


El  procedimiento  que  utilizamos  para  construir  un  intervalo  con  un  nivel  0.95  para  la  media  de 
una  distribución  normal,  se  puede  aplicar  para  cualquier  nivel  de  confianza  1  —  a,  en  este  caso  se 
reemplazan  los  valores  —1.96  y  1.96  por  los  valores  críticos  —  2a/2  y  zai 2,  entonces: 


y  llegamos  a: 


P 


(x  -  Za/ 2  X 


o 


<  ¡1  <  X  +  Za/2  x 


=  1  —  a 


Finalmente  al  intervalo: 


IC(1-a)  (n) 


(7 


j  X  +  za/2  x 


(5.6) 


Interpretación  de  un  intervalo  de  confianza 

En  el  Ejemplo  5.12,  decimos  que  el  nivel  de  confianza  es  0.95,  dado  que  la  probabilidad  de  que  el 
intervalo  aleatorio  (15.51)  contenga  al  parámetro  es  0.95.  Es  importante  recordar  que  al  reemplazar  los 
estadísticos  por  los  valores  de  la  muestra  obtuvimos  el  intervalo  de  números  reales  (191,  243),  éste 
ya  no  es  aleatorio  y  no  tiene  sentido  decir  que  contiene  a  /i  con  probabilidad  0.95.  La  interpretación 
correcta  del  “nivel  de  confianza”  es  la  siguiente:  supongamos,  para  el  ejemplo,  que  se  seleccionan 
muchas  muestras  aleatorias  de  12  hombres  de  esa  población  y  se  construyen  intervalos  de  confianza 
utilizando  el  mismo  procedimiento.  Con  cada  muestra  de  12  observaciones  tendremos  un  valor 
de  x  diferente,  y  en  consecuencia  un  intervalo  numérico  diferente.  Lo  que  podemos  afirmar  es  que 
aproximadamente  el  95  %  de  estos  intervalos  contendrán  al  verdadero  valor  fx ,  y  naturalmente  habrá 
aproximadamente  un  5  %  de  dichos  intervalos  que  no  contendrán  al  verdadero  valor  ¡x.  Entonces 
cuando  construimos  un  sólo  intervalo  de  nivel  0.95,  podemos  tener  un  95%  de  confianza  de  que 
ese  intervalo  sea  uno  de  los  que  contienen  a  fx. 
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En  esta  gráfica  se  muestran  el  verdadero  valor  de  ¿í  (línea  horizontal  azul)  y  los  /C'o.gsf/i)  obtenidos 
con  41  muestras  de  12  hombres.  Puede  verse  que  algunos  pocos  (los  intervalos  en  rojo)  no  contienen 


a  / 1 . 


Nivel  de  confianza,  precisión  y  tamaño  de  la  muestra  en  un  intervalo  de 
confianza 

Como  resulta  lógico,  es  deseable  que  el  nivel  de  confianza  1  —  a  sea  lo  mayor  posible,  pero 
el  valor  de  za  aumenta  cuando  elegimos  valores  más  grandes  para  el  nivel  1  —  a.  Por  ejemplo  si 
queremos  un  nivel  de  99  %  los  valores  críticos  son  -2.58  y  2.58.  Como  consecuencia  de  ésto  aumenta 
la  longitud  del  intervalo.  Esto  significa  que  si  se  quiere  más  seguridad  hay  que  pagarla  con  menos 
precisión.  En  el  Ejemplo  5.12,  si  deseamos  un  nivel  de  99%  de  confianza,  el  intervalo  será: 


la  longitud  de  este  intervalo  es  L  =  251  —  183  =  68,  mientras  que  al  nivel  del  95  %  la  longitud  fue 
de  L  =  243  -  191  =  52. 

¿Qué  deberíamos  hacer  si  queremos  tener  un  nivel  de  99%,  pero  mayor  precisión,  por  ejemplo 


una  longitud  no  mayor  de  20?  La  longitud  de  (15.61)  es  L  =  2  x  za/2  x  -^=,  entonces  reemplazando 

Vn 

los  valores,  za/2,  <r  y  n,  planteamos: 


y  obtenemos  n  >  140.8494.  En  consecuencia,  necesitaríamos  una  muestra  de  por  lo  menos  141 
hombres  para  lograr  un  intervalo  de  99%  de  confianza  con  longitud  no  mayor  de  20. 

En  general,  a  mayor  nivel  de  confianza  se  tiene  menor  precisión  (un  intervalo  más  largo),  y 


la  solución  para  conseguir  el  nivel  deseado  con  la  precisión  deseada  es  aumentar  el  tamaño  de  la 


muestra. 
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Para  el  caso  antes  analizado,  la  relación  entre  longitud  del  intervalo  y  error  de  estimación  se  ve 
en  la  siguiente  gráfica: 


Intervalos  para  la  media  de  una  población  normal  con  varianza  conocida 

Para  el  caso  en  que  la  m.a.  tenga  distribución  normal  con  varianza  conocida,  como  vimos  en  el 
Ejemplo  5.12,  la  función  pivote  es: 


Z  = 


X-n 

v/ypñ 


que  tiene  distribución  N(0,1).  Y  se  obtiene  el  siguiente  intervalo  de  confianza  de  nivel  1  —  a 


a  — 


IC'l-a(n)  —  (  X  ~  za/ 2  x  +  za/2  x 

V  \Jn  1  \Jn 


EJERCICIO  5.2 

Se  repitieron  4  mediciones  del  valor  de  creatinina  en  sangre  en  una  muestra,  con  un  método  cuyo 
desvío  estándar  es  0.09  mg/dL.  Siempre  se  supone  que  los  errores  de  medición  tienen  distribución 
normal.  Se  obtuvo  una  media  muestral  de  1.03  mg/dL. 

1  Calcule  un  intervalo  de  confianza  del  97  %  para  el  valor  de  creatinina  de  la  muestra. 

2,  Calcule  la  longitud  del  intervalo  de  confianza  obtenido. 

3.  ¿Cuántas  repeticiones  deberían  hacerse  para  que  la  longitud  del  intervalo  de  confianza  sea 
menor  que  0.15? 

Si  con  esos  datos  se  calculó  el  intervalo  de  confianza  (0.9418,  1.1182),  determine  cuál  es  el 
nivel  de  confianza  de  dicho  intervalo. 
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Intervalos  para  la  media  de  una  población  normal  con  varianza 
desconocida 

En  la  mayoría  de  los  problemas  reales,  aún  cuando  pueda  suponerse  que  la  distribución  de  los 
datos  es  aproximadamente  normal,  la  media  y  la  varianza  son  desconocidas.  En  ese  caso,  para 
construir  un  intervalo  de  confianza  para  la  media,  no  podemos  usar  la  función  pivote  que  usamos 
anteriormente,  porque  esa  función  depende  de  a  que  es  desconocido.  La  función  pivote  que  se  debe 
usar  es: 

T_*~ú 

S/y/ñ 

Cuando  las  son  una  m.a.  de  una  distribución  normal,  T  tiene  distribución  de  Student  con 
n  —  1  grados  de  libertad,  que  se  denota  como  Trn_u.  Esta  distribución  es  simétrica,  y  existen 
tablas  con  los  valores  críticos  para  ciertos  valores  de  grados  de  libertad.  Las  siguientes  tres  gráficas 
corresponden  a  las  funciones  de  densidad  para  distintos  valores  de  n: 


Notación 

Sea  T  ~  T(n)  y  sea  0  <  a  <  1,  se  define  el  valor  crítico  ta^n  como  el  valor  que  verifica 
P(T  >  ta>n)  =  a. 


Entonces,  siguiendo  el  procedimiento  antes  descrito,  obtenemos  el  siguiente  intervalo 
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de  100(1  —  a)  %  de  confianza  para  parámetro  /i 


/Ci-cfa) 


ta/2,n—  1  ^ 


—¡=-  X  +  ía/2,n-l 
Vn 


X 


(5.7) 


Ejemplo  5.13 


Consideremos  las  siguientes  7  mediciones  de  la  concentración  de  ion  nitrato  (en  g/ml)  en  una 
muestra  de  agua: 

49  50  51  51  52  53  48 


Se  desea  estimar  el  valor  verdadero  /r  de  la  concentración,  mediante  un  intervalo  de  confianza. 
Se  supone  que  cada  observación  es  una  v.a.  con  distribución  normal  con  media  n,  la  que 
estimamos  con  la  media  muestral  x  =  50.57. 

Como  cada  es  una  v.a.  con  distribución  normal,  consideramos  la  función  pivote 


T  = 


X  —  ¡i 
S/y/ñ 


que  tiene  distribución  T(„_1p  Reemplazando  X  y  S  por  los  valores  calculados  x  y  s,  obtenemos 
un  intervalo  real.  En  nuestro  caso,  x  =  50.57,  s  =  1.72,  y  tomemos  1  —  a  =  0.95  (el  nivel  de 
confianza  es  95%),  se  busca  en  la  tabla  el  valor  correspondiente  a  grados  de  libertad  n  —  1  =  6 
y  a/2  =  0.025,  que  es  to. 025,6  =  2.4469. 

El  intervalo  es 


1  72  1  72' 

50.57  -  2.4469  x  -—,50.57  +  2.4469  x  )  =  (48.98, 52.16) 

V7  V7  ' 


EJERCICIO  5.3 

Se  midieron  las  tallas  (en  cm)  a  los  12  meses  de  edad  de  16  niñas  con  hipotiroidismo  congénito 
(HC).  Se  obtuvieron  los  siguientes  valores  x  =  73.85  y  s  =  2.58.  Se  puede  suponer  que  la  talla  es 
una  variable  aleatoria  con  distribución  normal. 

1  Construya  un  intervalo  de  98  %  de  confianza  para  la  talla  media  a  los  12  meses  de  edad  de 
las  niñas  con  HC. 

2.  Calcule  la  longitud  del  intervalo  de  confianza  obtenido. 


Intervalos  de  confianza  para  la  media  con  muestras  grandes 

Para  construir  el  intervalo  de  confianza  <52*  nos  basamos  en  la  suposición  de  que  la  distribución 
de  la  población  era  normal.  Si  ése  no  es  el  caso,  la  función  pivote  utilizada  no  tendría  distribución 
de  Student.  Cuando  no  conocemos  la  distribución  de  los  datos,  es  necesario  usar  algún  tipo  de 
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aproximación.  Recordemos  el  Teorema  Central  del  Límite  (TCL)  que  vimos  en  el  CapítulolH  según 
este  teorema,  si  tenemos  una  m.a.  Xi,  . . . ,  Xn  de  cualquier  distribución  y  n  es  suficientemente 
grande,  la  distribución  de 


Z  = 


X- g 


se  aproxima  a  una  N( 0, 1).  Se  puede  demostrar  que  si  se  reemplaza  cr  por  S ,  la  distribución  también 
se  aproxima  a  una  N( 0, 1).  Este  resultado  es  el  que  usaremos  cuando  no  conocemos  la  distribución 
de  los  datos.  El  procedimiento  es  el  mismo,  partimos  de  la  función  pivote 


que,  considerando  que  n  es  grande,  tiene  una  distribución  aproximadamente  N( 0, 1).  Entonces  los 
valores  críticos  que  elegimos  son  —za/2  y  0a/2  y  podemos  afirmar  que: 


La  contaminación  de  metales  pesados  de  varios  ecosistemas  es  una  amenaza  ambiental.  Un 
artículo  científico  reporta  que,  para  una  muestra  de  n  =  56  peces  de  la  especie  Mugil  liza,  la 


concentración  media  muestral  de  zinc  en  el  hígado  fue  de  9.15  gg/g  y  la  desviación  estándar 
muestral  fue  de  1.27  gg/g.  Se  desea  estimar  la  concentración  media  poblacional  de  zinc  en  el 
hígado  de  esa  especie  de  peces,  mediante  un  intervalo  de  95  %  de  confianza. 


Como  n  es  suficientemente  grande,  la  distribución  de 


X  -  /i 

S/^Jñ 


se  aproxima  a  una  JV(0, 1).  Reemplazando  con  los  datos  del  ejemplo,  x  =  9.15,  s  =  1.27,  y 
2:0.025  =  1-96,  obtenemos:  (8.82,9.48),  este  intervalo  tiene  nivel  de  confianza  aproximado  de 


95%. 


Ahora,  si  deseamos  hallar  el  valor  de  n  para  el  cual  la  longitud  del  intervalo  del  95  %  de 
confianza  sea  a  lo  sumo  0.5,  el  planteo  sería: 


2  X  00.025  x 


S 


<  0.5 


(5.8) 


Observemos  que  S  también  depende  de  n.  En  estos  casos,  se  reemplaza  el  valor  de  S  de  alguna 
muestra  previa  que  se  tenga.  En  nuestro  caso,  en  (15.81)  nos  quedará  que 


1.27 

2  x  1.96  x  — ^  <  0.5  => 

V« 


Entonces,  el  valor  de  n  debe  ser  al  menos  100. 
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EJERCICIO  5.4 

En  un  estudio  nutricional  se  evaluó  el  consumo  diario  de  calorías  en  un  grupo  de  40  adolescentes 
de  sexo  femenino.  La  media  y  desviación  típica  muéstrales  de  esos  valores,  en  kilocalorías  por 
kilogramos,  fueron  x  =  32.85  y  s  =  5.76.  No  hay  evidencias  de  que  el  consumo  diario  de  calorías 
siga  una  distribución  normal. 

Construya  un  intervalo  de  aproximadamente  95  %  de  confianza  para  la  media  del  consumo 
diario  de  calorías  para  la  población  de  adolescentes. 

2  Si  se  desea  que  la  longitud  del  intervalo  de  confianza  no  sea  mayor  que  3,  ¿cuántas  adolescentes 
es  necesario  encuestar? 


Intervalos  de  confianza  con  muestras  grandes  para  una  proporción 


Sea  X  una  v.a.  con  distribución  binomial  con  parámetros  n  y  p1  por  lo  tanto: 

E(X)  =  np  y  dt(X)  =  \/np(l  -  p) 

Ya  vimos  que  p  =  — .  la  proporción  observada  en  la  muestra,  es  un  estimador  insesgado  de  p 
n 


y  cumple: 


E{p)  =p  y  dt{p)  = 


P(1  ~P) 


Con  el  caso  particular  del  TCL  para  la  binomial,  sabemos  que  la  distribución  de 

P~P  ■  a  Tin  i\ 

se  aproxima  a  una  /V  (U,  1) 


n 

También  vale  que  la  distribución  de 

P~P 


se  aproxima  a  una  1V(0, 1) 


/p(i-p) 
y  n 

Entonces  eligiendo  los  valores  críticos  —za/ 2  y  za/ 2,  se  cumple: 


P  I  --a/2  <  J=  P  <  -a/2  I  =  1  ~  Oí 
P(1~P) 


Luego,  se  puede  obtener  un  intervalo  de  confianza  para  p  con  nivel  aproximadamente  1  —  a 
(para  n  grande),  de  la  forma: 


ic,-m  =  1 1-  w  x  >/aL^).p+ x„/a  x  ■ 


y  abreviado  es: 


ICl-a(p)  =P±  Za/ 2  X 


F(i  -p) 
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Aclaración 


En  la  práctica,  el  extremo  inferior  del  intervalo  podría  dar  negativo,  en  cuyo  caso  se  lo  hace 
igual  a  cero;  de  igual  forma,  si  el  extremo  superior  da  mayor  que  1,  se  lo  hace  igual  a  1. 


Ejemplo  5.15 


Se  realizó  un  estudio  para  detectar  anemia  en  niños  menores  de  6  años  en  una  comunidad  rural.  Se 
seleccionaron  al  azar  230  niños  de  esa  comunidad  y  se  encontraron  107  con 
anemia  ( Hg  <  11  g/dl).  Se  desea  estimar  mediante  un  intervalo  de  confianza  el  porcentaje 
de  niños  con  anemia  en  esa  comunidad.  El  número  de  casos,  en  la  muestra  de  230,  con  anemia 
es  x  =  107. 

Definimos  a  la  variable  aleatoria  X  como  la  cantidad  de  niños  menores  de  6  años  con  anemia 
entre  230.  Luego  X  es  una  v.a.  con  distribución  binomial  con  parámetros  230  y  p,  luego  consi¬ 
deramos  la  función  pivote 

P~P  ■  ATin  i\ 

— que  se  aproxima  a  una  A  (0, 1) 

i/sp 

En  nuestro  caso,  p  =  0.4652,  y  si  elegimos  1  —  a  =  0.95,  es  za/2  =  1.96,  luego  el  intervalo 
resulta 


(0.4007,0.5297) 


(5.9) 


Conociendo  el  tamaño  de  la  población,  se  puede  construir  un  intervalo  de  confianza  para  la 
cantidad  de  individuos  en  esa  población  que  tienen  la  característica  que  se  está  estudiando.  En  el 
Ejemplo  5.15,  si  se  desea  evaluar  los  costos  de  un  programa  de  intervención  para  mejorar  la  salud 
comunitaria,  interesa  conocer  el  número  de  niños  con  anemia. 

Llamemos  A  a  la  cantidad  de  niños  menores  de  6  años  en  la  población,  y  M  a  la  cantidad 
de  niños  con  anemia,  la  verdadera  proporción  de  niños  con  anemia  se  define  como  p  =  M/N, 
y  de  allí  M  =  Np ,  entonces  se  puede  estimar  M  =  pN.  En  el  ejemplo  anterior,  si  N  =  1500, 
M  =  0.4652  x  1500  =  697.8. 

Para  construir  un  intervalo  de  confianza  para  M  se  puede  proceder  como  sigue:  sabemos  que 


P  -  za/ 2 


p(l~p) 


<p  <p  +  za/2  x 


p{  1  -  P) 


=  1  —  a 


entonces  si  multiplicamos  por  N : 

JV|p-Z„/2x./»-« 


<  Np  <  N  p  +  2:^/2  x 


p(l-p) 


n 


=  1  —  a 


obtendremos  el  intervalo  de  nivel  1  —  a  para  M  que  es: 
ICi-a(M)  =  (-/VÍ  p—  za¡  2  x 


PÍ 1  -  P) 


N  p  +  za/2  X 


p{  1  -  p) 


n 
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En  el  ejemplo,  si  a  los  extremos  del  intervalo  (ESJ)  los  multiplicamos  por  el  valor  de  N, 
obtendremos  (601.05,  794.55),  pero  recordando  que  M  es  un  número  natural,  finalmente  obtenemos 
(601,795). 


Nivel  de  confianza,  precisión  y  tamaño  de  la  muestra 


En  el  Ejemplo  5.15,  la  longitud  del  intervalo  para  la  proporción  de  niños  con  anemia,  es  0.129. 
En  general,  la  longitud  es: 


L  =  2  x  za/2  x 


F(i  -p) 


(5.10) 


Si  se  pretende  estimar  la  proporción  de  niños  anémicos  con  un  error  de  estimación  no  mayor  del 
5  %,  esto  quiere  decir  que  la  longitud  del  intervalo  no  debe  ser  mayor  que  0.10,  antes  de  realizar  el 
estudio  se  debería  determinar  cuántos  niños  o  cuántas  muestras  de  sangre  se  necesitarán  analizar. 

El  problema  en  este  caso,  es  que  la  longitud  del  intervalo  (15.101)  depende  también  de  p  que  no 
se  conoce  antes  del  estudio.  Pero  se  puede  ver  fácilmente  que  para  cualquier  p  vale,  p(  1  —p)  <  1/4 
como  se  muestra  en  la  siguiente  gráfica: 


Entonces: 


L  =  2  x  za¡ 2  x 


Í>(1  ~P) 


<2X2, 


/  2 


•^a/2 


y/ñ 


Luego  si  queremos  que  L  <  d,  debemos  hacer  za/ 2/ y/ñ  <  d  y  de  allí  podemos  despejar  el  valor 
de  n  necesario  para  que  la  longitud  del  intervalo  sea  a  lo  sumo  d. 

Para  el  ejemplo  anterior: 


L  =  2  x  1.96  x 


Rlzñ  <  <  0.10 


luego  n  >  (1.96/0. 10)2  =  384.16  entonces  si  n  es  al  menos  385,  nos  aseguramos  que  la  longitud  del 
intervalo  será  menor  de  0.10. 
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EJERCICIO  5.5 


Una  de  las  metas  de  un  programa  de  pesquisa  neonatal  de  hipotiroidismo  congénito,  es  lograr  la 
detección  de  la  enfermedad  en  los  primeros  días  de  vida,  por  ese  motivo  el  protocolo  de  la  pesquisa 


indica  que  la  muestra  de  sangre  para  el  análisis  debe  ser  tomada  en  los  primeros  5  días  de  vida.  Se 


quiere  construir  un  intervalo  de  confianza  de  nivel  aproximado  0.95,  para  la  proporción  de  casos 
donde  no  se  cumple  el  protocolo,  analizando  los  registros  del  programa. 

Si  se  desea  que  la  longitud  del  intervalo  de  confianza  para  esa  proporción  sea  menor  que  0.05, 
¿cuántos  registros  se  deberían  observar? 

2.  Si  se  supone  que  dicha  proporción  es  menor  que  0.20,  y  se  desea  que  la  longitud  del  intervalo 
de  confianza  sea  menor  que  0.05,  ¿cuántos  registros  se  deberían  observar? 

3.  Se  eligieron  al  azar  300  registros  de  ese  programa  y  se  observó  que  en  54  casos  la  muestra 
había  sido  tomada  después  de  los  5  días  de  vida.  Construya  el  intervalo  de  confianza  para  la 
proporción  de  casos  en  que  no  se  cumple  el  protocolo. 

Si  este  programa  se  aplica  a  todos  los  recién  nacidos  en  una  región,  donde  hay  aproximada¬ 
mente  10000  nacimientos  por  año.  Construya  un  intervalo  de  confianza  para  el  número  de 
niños  a  los  que  se  les  realiza  la  toma  de  muestra  después  del  tiempo  especificado. 


Intervalos  para  la  varianza  de  una  distribución  normal 

Hay  situaciones  en  que  interesa  hacer  inferencias  sobre  la  varianza  o  la  desviación  típica,  por 
ejemplo  cuando  queremos  conocer  la  precisión  de  un  método  de  medición. 

Si  tenemos  una  m.a.  de  una  distribución  normal  y  queremos  calcular  un  intervalo  de  confianza 
para  la  varianza,  la  función  pivote  h(Xi,X2, . . . ,  Xn,  a2),  que  usaremos  es: 


ya  que  puede  demostrarse  que,  cuando  las  X,  tienen  distribución  N(n,  a2),  V  tiene  distribución 
Chi-cuadrado  con  n  —  1  grados  de  libertad,  xfn-i )•  Esta  distribución  no  es  simétrica,  la  densidad 
es  no  nula  sólo  para  x  >  0. 


0.5 


0.4 


0.3 


0.2 


o.i 


0  1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20 
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También  existen  tablas  para  los  valores  críticos  de  esta  distribución,  para  diferentes  valores  de 
grados  de  libertad. 

Notación 

Sea  U  ~  xfn)  Y  sea  0  <  a  <  1,  se  define  el  valor  crítico  Xa,n  como  el  valor  que  verifica 
p(u  >  Xa,  J  =  «• 


Como  siempre,  necesitamos  un  par  de  valores  tales  que  V  se  encuentre  entre  ellos  con  probabili¬ 
dad  1  —  a.  Pero  esta  distribución  no  es  simétrica,  entonces  deberemos  elegir  los  valores  X2_Q/2  n-i 

y  X«/2,n-l  tales  Clue: 

„  /  2  (n  -  l)^2  2  \  _  . 

P  yXl-a/2,n-l  ^  ^2  ^  Xa/2,n-lJ  ~  ^  a 


y  finalmente  el  intervalo: 


ICi-a{a2) 


{n-l)S2 

X-oi/2,n—l 


( n  —  1)S'2 

Xl-a/2,n-l 


de  extremos  aleatorios.  Como  siempre,  esto  significa  que  el  verdadero  valor  de  a2  se  encuentra  en 
ese  intervalo  con  probabilidad  1  —  a.  Reemplazando  el  estimador  S2  por  el  valor  de  la  muestra  s2, 
obtenemos  un  intervalo  numérico. 


Ejemplo  5.16 


Volviendo  a  los  datos  del  Ejemplo  5.13,  consideramos  la  función  pivote: 

(n-l)S2 

CT2 

Cuando  las  X¿  tienen  distribución  ÍV(/x,cr2),  V  tiene  distribución  Chi-cuadrado  con  n  —  1  grados 
de  libertad.  Luego  tenemos  que  s  =  1.718  y  eligiendo  1— a  =  0.95,  los  valores  críticos  los  buscamos 
en  la  tabla  de  la  Chi-cuadrado  con  n  —  1  =  6  grados  de  libertad,  obteniendo  X0.025  6  =  14.4494 
y  Xo.975,6  =  1-2373 
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Finalmente,  el  intervalo  para  a2  es: 


/ 6  x  1.7182  6  x  1.7182\ 
V  14.4494  ’  1.2373  ) 


(1.23,14.31) 


Si  deseamos  un  intervalo  para  a,  debemos  sacar  raíz  cuadrada  a  cada  extremo  del  intervalo 
anterior,  así  obtenemos  (1.11,3.78). 


EJERCICIO  5.6 

Usando  los  datos  del  Ejercicio  5.3,  calcular  intervalos  de  confianza  de  nivel  0.95  para  la  varianza  y 
el  desvío  estándar  de  la  distribución  de  tallas  en  la  población  estudiada. 
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CAPITULO  6 


Tests  de  hipótesis 


Introducción 


En  el  capítulo  anterior  vimos  cómo  estimar  un  parámetro  con  un  solo  número  (una  estimación 
puntual)  o  un  intervalo  completo  de  valores  plausibles  (un  intervalo  de  confianza),  a  partir  de 
los  datos  muéstrales.  Con  frecuencia,  sin  embargo,  el  objetivo  de  una  investigación  no  es  estimar 
un  parámetro  sino  decidir  cuál  de  dos  pretensiones  contradictorias  sobre  él  es  la  correcta.  Los 
métodos  para  lograr  esto  constituyen  la  parte  de  la  inferencia  estadística  llamada  pruebas  o  tests 
de  hipótesis. 

En  muchos  aspectos,  el  procedimiento  formal  para  pruebas  de  hipótesis  es  semejante  al  método 
científico.  Observar  la  naturaleza,  formular  una  teoría  y  confrontarla  con  lo  observado. 

En  nuestro  contexto,  tenemos  una  hipótesis  sobre  la  población  (por  ejemplo  acerca  de  su  media 
o  de  su  varianza)  y  queremos  saber  si  es  cierta  o  no,  para  verificarla  tomamos  una  muestra  aleatoria, 
y  en  función  de  la  misma,  decidimos  si  la  aceptamos  o  no. 

Ahora  bien,  ¿cómo  se  utiliza  la  estadística  en  este  procedimiento?  Probar  una  hipótesis  requiere 
tomar  una  decisión  cuando  se  compara  la  muestra  observada  contra  la  teoría  propuesta.  ¿Cómo 
decidimos  si  la  muestra  concuerda  o  no  con  la  hipótesis  del  científico?  ¿Cuándo  debemos  rechazar 
la  hipótesis  y  cuándo  debemos  aceptarla?  ¿Cuál  es  la  probabilidad  de  que  tomemos  una  mala 
decisión?  Y,  en  particular,  ¿qué  función  de  las  mediciones  muéstrales  debe  emplearse  para  llegar  a 
una  decisión?  En  este  capítulo  trataremos  de  dar  respuesta  a  estas  preguntas. 
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Test  de  hipótesis  para  la  media  de  una  distribución  normal 
con  varianza  conocida 


Para  presentar  las  ideas  de  test  de  hipótesis,  comencemos  desarrollando  un  ejemplo: 

Una  concentración  de  mercurio  (Hg)  en  el  agua  igual  a  1  mcg/l ,  se  considera  un  riesgo  para  la 
salud.  Se  realizan  6  determinaciones  de  concentración  de  Hg  en  una  muestra  de  agua  y  se  obtienen 
los  siguientes  valores  (mcg/l): 

0.86  0.89  0.93  1.02  0.96  0.83 

Suponemos  que  el  método  tiene  un  error  de  medición  con  a  =  0.08  mcg/l.  Queremos  determinar 
si  esa  muestra  de  agua  puede  considerarse  libre  de  contaminación.  Para  ello,  debemos  decidir  entre 
estas  dos  hipótesis: 

•  La  concentración  de  Hg  en  la  muestra  de  agua  es  admisible. 

•  La  concentración  de  Hg  en  la  muestra  de  agua  es  un  riesgo  para  la  salud. 

Podemos  modelizar  esta  situación  como  sigue:  tenemos  una  m.a.  Xi,  X2, . . . ,  Xq  donde  cada  X, 
es  el  resultado  de  la  i-ésima  determinación  y  tiene  distribución  N(g,  0.082).  El  problema  a  resolver 
es  decidir  cuál  de  las  siguientes  hipótesis  es  cierta: 

H0  :  g  =  1  (el  agua  es  un  riesgo  para  la  salud) 

Ha  :  g  <  1  (el  agua  es  admisible) 

donde  H0  se  llama  hipótesis  nula  y  Ha  hipótesis  alternativa. 

Debemos  notar  que  al  decidirnos  por  una  de  las  dos  hipótesis,  pueden  ocurrir  alguna  de  estas 
cuatro  situaciones: 


Decisión  a  partir  del  test 

Ho  es  cierta 

Ho  no  es  cierta 

Se  rechaza  Ho 

error  tipo  I 

correcto 

No  se  rechaza  Hq 

correcto 

error  tipo  II 

Como  se  aprecia  en  la  tabla  anterior,  pueden  cometerse  dos  tipos  de  errores,  que  se  los  distingue 
con  los  nombres  de  error  de  tipo  I  y  error  de  tipo  II. 

En  nuestro  ejemplo  el  error  de  tipo  I  sería  afirmar  que  la  muestra  de  agua  tiene  una  concentra¬ 
ción  de  mercurio  aceptable  (/i  <  1),  cuando  en  realidad  la  concentración  es  alta.  Y  el  error  de  tipo 
II  sería  afirmar  que  la  muestra  de  agua  tiene  una  concentración  alta  (p  =  1),  cuando  en  realidad 
es  más  baja.  En  este  caso,  el  error  de  tipo  I  es  más  grave  que  el  error  de  tipo  II. 

Los  procedimientos  que  vamos  a  ver,  nos  permiten  acotar  la  probabilidad  de  cometer  un  error 
de  tipo  I. 

Recordemos  que  nunca  conocemos  cuánto  vale  g  y  sólo  podemos  hacer  inferencias,  acerca  de 
su  valor,  basadas  en  la  muestra.  Sabemos  que  X  es  un  estimador  de  g  y  el  valor  x  observado  es 
una  estimación  del  verdadero  g.  Entonces,  si  x  resulta  mucho  más  chico  que  1,  tendremos  motivos 
para  pensar  que  en  realidad  g  <  1  (cuanto  menor  sea  x ,  mayor  será  la  evidencia  contra  Hq  a 
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favor  de  Ha)-  Debemos  decidir  cuándo  consideramos  que  x  es  lo  suficientemente  pequeño  como 
para  rechazar  la  hipótesis  nula,  manteniendo  acotada  la  probabilidad  de  error  de  tipo  I.  Para  esto 
debemos  considerar  un  estadístico  (estadístico  de  prueba)  con  distribución  conocida  cuando  Hq  es 
verdadera  y  definir  una  zona  de  rechazo.  En  nuestro  ejemplo,  usaremos  el  estadístico  de  prueba: 

X-l  _  V6(X~1) 

0.08/-\/6  0.08 

que  bajo  el  modelo  propuesto  y  cuando  Hq  es  verdadera,  tiene  distribución  N(0, 1). 

Supongamos  que  queremos  que  la  probabilidad  de  error  de  tipo  I  sea  0.05.  Se  puede  establecer 
una  regla  de  decisión  como  la  siguiente:  rechazar  Hq  cuando  el  valor  del  estadístico  de  prueba  sea 
menor  que  —1.645;  de  este  modo  nos  aseguramos  que: 


P{  error  de  tipo  I  )  =  P 


(  V&(x-\) 
^  0.08 


<  -1.645 


Hq  es  verdadera 


$(-1.645)  =  0.05 


En  general,  para  que  la  probabilidad  de  error  de  tipo  I  sea  a  la  regla  será: 


rechazar  H0  :  /i  =  1  cuando  z  = 


\/6  (x  —  1) 
008 


ya  que: 


P(  error  de  tipo  I  )  =  P  ^—7777-—^ 


0.08 


<  -zn 


H0  es  verdadera  =  $(— za)  =  a 


Este  valor  a  se  llama  nivel  de  significación.  Al  fijar  un  nivel  de  significación  a  =  0.05,  nos 
aseguramos  que  la  probabilidad  de  cometer  un  error  de  tipo  I,  no  puede  ser  mayor  que  0.05.  Para 
este  test,  llamamos  zona  de  rechazo  a  los  valores  del  estadístico  de  prueba  menores  que  —  za,  puede 
verse  que  el  área  bajo  la  curva  de  densidad  en  la  zona  de  rechazo  es  igual  a  a. 

Con  los  datos  del  ejemplo,  al  reemplazar  X  por  x  =  0.915,  el  valor  que  toma  el  estadístico  es: 

=  —2.60,  este  valor  cae  en  la  zona  de  rechazo,  de  modo  que  podemos  rechazar  Hq  con 
nivel  a  =  0.05.  Es  decir,  podemos  afirmar  que  la  concentración  de  Hg  en  la  muestra  de  agua  está 
dentro  de  los  niveles  admisibles,  y  la  probabilidad  de  equivocarnos  al  hacer  esta  afirmación  es  a  lo 
sumo  0.05.  También  se  dice  que  el  resultado  es  significativo  al  5%. 

También  podemos  razonar  de  esta  manera:  si  /i  =  1,  ¿cuál  es  la  probabilidad  de  obtener  una 
media  muestral  que  fuera  tanto  o  más  pequeña  que  la  observada?,  o  lo  que  es  equivalente,  ¿cuál 
es  la  probabilidad  de  que  el  estadístico  de  prueba  sea  menor  o  igual  que  —2.60,  si  /./,  =  1?  Esta 
probabilidad  puede  calcularse  ya  que  el  estadístico  de  prueba  tiene  distribución  ÍV(0, 1)  cuando 
¿í  =  1  y  es: 


P{Z  <  -2.60)  =  $(-2.60)  =  0.0047 

Esto  es  lo  que  se  llama  el  “valor-p”,  cuanto  menor  sea  este  p,  más  evidencia  tengo  contra  H0- 
En  nuestro  ejemplo,  valor-p  =  0.0047  es  una  probabilidad  muy  pequeña,  podemos  rechazar  Hq  y 
afirmar  la  hipótesis  alternativa,  es  decir  que  ¿i  <  1  con  fuerte  convicción. 

El  valor-p  se  puede  definir  como  el  menor  nivel  de  significación  (el  más  exigente)  para  el  cual 
se  puede  rechazar  Hq  con  los  valores  observados.  Otra  manera  de  expresar  la  regla  de  decisión  es: 
se  rechaza  Hq  cuando  el  valor-p  es  menor  que  el  a  elegido. 
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En  este  caso  el  valor-p  =  0.0047,  esto  significa  que  podemos  rechazar  Hq  con  cualquier  a  > 
0.0047  que  es  equivalente  a  decir  que  el  resultado  es  significativo  al  0.47%. 

Cualquier  prueba  de  hipótesis  estadística  funciona  de  la  misma  forma  y  está  compuesta  de  los 
mismos  elementos  esenciales. 

Un  test  o  prueba  de  hipótesis  es  un  proceso  de  decisión  que,  en  función  de  los  datos  de  una 
m.a.  Xi .  X'2, . . .  ,Xn,  nos  permite  decidir  entre  la  validez  de  dos  hipótesis  contradictorias. 

Los  elementos  de  un  test  de  hipótesis  son: 

1.  Las  hipótesis:  hipótesis  nula  e  hipótesis  alternativa. 

2.  El  estadístico  de  prueba. 

3.  La  región  de  rechazo. 

Definiremos  a  continuación  formalmente  estos  elementos: 

Definición: 

Las  hipótesis  nula  y  alternativa  son  hipótesis  contradictorias  sobre  el  parámetro  de  interés. 

Se  decide  cuál  es  la  hipótesis  alternativa,  de  modo  que  el  error  de  tipo  I  sea  el  más  grave 
(ya  que  la  probabilidad  de  cometer  dicho  error  quedará  acotada).  Habitualmente,  en  los 
trabajos  de  investigación,  la  hipótesis  alternativa  es  la  que  el  investigador  desea  demostrar. 


Definición: 

El  estadístico  de  prueba  es  una  función  de  la  muestra  aleatoria,  y  debe  tener  una  dis¬ 
tribución  conocida  cuando  el  valor  del  parámetro  sea  el  que  indica  la  hipótesis  nula.  La 
decisión  estadística  estará  basada  en  el  valor  del  estadístico  de  prueba. 


Definición: 

La  región  de  rechazo  especifica  los  valores  del  estadístico  de  prueba  para  los  cuales  la 
hipótesis  nula  ha  de  ser  rechazada  a  favor  de  la  hipótesis  alternativa.  Se  define  de  modo 
que  la  probabilidad  de  cometer  error  de  tipo  I  sea  igual  a  a.  Este  valor  a  se  llama  nivel 
de  significación  del  test,  y  es  elegido  “a  priori”  por  el  investigador  (generalmente  0.05). 

El  área  de  la  zona  de  rechazo  es  igual  al  nivel  de  significación  (a)  elegido. 

Entonces  con  todos  estos  elementos,  para  una  muestra  particular,  si  el  valor  calculado  del 
estadístico  de  prueba  cae  en  la  región  de  rechazo,  rechazamos  la  hipótesis  nula  Hq  y  aceptamos  la 
hipótesis  alternativa  Ha,  sabiendo  que  la  probabilidad  de  equivocarnos  (error  de  tipo  I)  es  a.  Si  el 
valor  del  estadístico  de  prueba  no  cae  en  la  región  de  rechazo,  concluimos  que  a  partir  de  los  datos, 
no  tenemos  evidencia  suficiente  para  rechazar  Hq;  si  nos  equivocamos  estaríamos  cometiendo  un 
error  de  tipo  II,  la  probabilidad  de  error  de  tipo  II  se  suele  llamar  /3  y  es  más  difícil  de  calcular. 
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Ejemplo  6.1 


Para  el  ejemplo  de  la  introducción,  los  elementos  del  test  de  hipótesis  son: 

Las  hipótesis:  H0  :  /i  =  1  vs.  Ha  :  n  <  1.  Este  ejemplo  corresponde  a  un  test  unilateral 
pues  la  alternativa  sólo  puede  ocurrir  en  una  dirección  (hacia  la  izquierda). 


2. 

3. 


El  estadístico  de  prueba: 
La  región  de  rechazo:  z  = 


Z  =  ^  ^ - —  y  cuando  H0  es  verdadera,  Z  ~  N( 0. 1). 

0.08  J  y  J 

v/6  (x  —  1) 


0.08 


<  —  os  =  —1.645,  gráficamente: 


En  el  gráfico  se  puede  ver  que  el  estadístico  de  prueba  z  =  —2.60  cae  dentro  de  la  región  de 
rechazo. 


Definición: 

Se  define  el  valor-p  como  la  probabilidad  de  que  el  estadístico  de  prueba  tome  un  valor 
“tan  extremo”  como  el  obtenido,  si  fuera  cierta  la  hipótesis  nula.  O  también  puede  definirse 
como  el  menor  nivel  de  significación  a,  para  el  cual  se  puede  rechazar  la  hipótesis  nula  con 
los  valores  observados. 


Observación: 


Las  dos  definiciones  de  anteriores  de  valor-p  son  equivalentes.  Es  importante 
observar  que,  el  valor-p  y  el  nivel  de  significación  son  cosas  diferentes:  el  valor-p 
depende  de  los  valores  observados,  mientras  que  el  nivel  de  significación  se  elige 
a  priori. 

Si  el  valor-p  es  menor  o  igual  a  un  nivel  de  significancia  a  asignado  previamente, 
entonces  la  hipótesis  nula  puede  ser  rechazada  con  dicho  a  y  se  puede  afirmar 
que  los  resultados  son  estadísticamente  significativos  a  ese  nivel. 


El  Ejemplo  6.1  es  un  test  unilateral,  analicemos  ahora  un  ejemplo  donde  la  hipótesis  alternativa 
es  bilateral. 
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Ejemplo  6.2 


Una  importante  propiedad  de  un  método  analítico  es  que  no  tenga  error  sistemático.  Ya  vimos 
que  el  resultado  de  una  medición  puede  modelizarse  como  una  variable  aleatoria  con  distribución 
normal,  cuya  media  es  igual  al  verdadero  valor  del  analito,  cuando  el  método  no  tiene  error 
sistemático.  Un  error  sistemático  implicaría  que  esa  media  difiere  del  valor  verdadero  del  analito. 
Para  ver  si  se  verifica  esta  propiedad,  se  analiza  con  dicho  método  una  muestra  estándar  con  valor 
conocido  del  analito.  En  este  ejemplo,  se  quiere  determinar  si  un  método  para  medir  selenourea 
en  agua  tiene  error  sistemático.  Para  ello,  se  analizaron  muestras  de  agua  de  grifo  adicionadas 
con  50  ng/ml  de  selenourea.  Se  sabe  que  la  desviación  típica  del  error  de  medición  es  0.9  ng/ml. 
Se  obtuvieron  los  siguientes  valores  (medidos  en  ng/ml): 

48.8  50.2  50.1  48.1  48.7  49.4 

En  este  ejemplo  queremos  decidir  entre  estas  dos  hipótesis: 

•  el  método  de  medición  no  tiene  error  sistemático 


el  método  de  medición  tiene  error  sistemático 


Podemos  plantear  el  siguiente  modelo  probabilístico: 

Sea  X-¡ .  X2; . . .  ,Xn  una  m.a.  donde  X¿  es  el  resultado  de  la  i-ésima  medición  del  contenido 
de  selenourea  en  la  muestra  de  agua  y  la  suponemos  con  distribución  N(g,0.92).  En  este  caso 
n  =  6.  Si  el  método  no  tiene  error  sistemático,  la  media  g  es  igual  al  verdadero  contenido  de 
selenourea  en  esa  muestra.  Con  este  modelo  las  hipótesis  se  escriben: 

H0  :  g  =  50  (el  método  de  medición  no  tiene  error  sistemático) 

Ha  :  g  ^  50  (el  método  de  medición  tiene  error  sistemático) 


Usaremos  el  estadístico  de  prueba: 


Z  = 


VQ  ( X  -  50) 
09 


que,  bajo  el  modelo  propuesto  y  cuando  Hq  es  verdadera,  tiene  distribución  N( 0, 1). 

En  este  caso,  parece  lógico  rechazar  H0  cuando  x  sea  mucho  mayor  o  mucho  menor  que  50.  La 
regla  de  decisión  será:  rechazar  H0  cuando  el  valor  absoluto  del  valor  del  estadístico  de  prueba 
sea  mayor  que  1.96,  de  este  modo  nos  aseguramos  que: 


P{  error  de  tipo  I  )  =  P 


ÍV6\X-  50 1 
^  09 


>  1.96 


H0  es  verdadera 


2(1  -  $(1.96))  =  0.05 


En  general,  en  un  test  bilateral,  para  que  la  probabilidad  de  error  de  tipo  I  sea  a  la  regla 
será: 


rechazar  Hq  :  g 


go  cuando 


>  za/2 


entonces: 


P(  error  de  tipo  I  )  =  P 


y/ñ\X  -  g0\ 


>  Za/2 


Hq  es  verdadera 


2(1  -  <Hza/2))  =  a 
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En  nuestro  ejemplo,  con  las  6  mediciones  se  obtuvo  x  =  49.217,  reemplazando  X  por 
x  =  49.217,  el  estadístico  de  prueba  toma  el  valor  v/^(4902g7~50'>  =  —2.13.  Como  este  valor 
cae  en  la  región  de  rechazo,  pues  |  —  2. 13|  >  1.96,  podemos  rechazar  la  hipótesis  nula  con  nivel 
0.05.  Esto  significa  que  podemos  afirmar  que  ^  /  50,  es  decir,  el  método  tiene  error  sistemático 
y  la  probabilidad  de  equivocarnos  al  hacer  esta  afirmación  es  a  lo  sumo  0.05. 

También  podemos  calcular  el  valor-p: 


valor-p  =  P 


í  y/6  \X  —  50| 
^  09 


>  |-2.13| 


H0  es  verdadera 


P(\Z\  >  2.13) 


=  P(Z  >  2.13)  +  P(Z  <  -2.13)  =  2(1  -  $(2.13))  =  0.0332 


Observación: 

Los  test  bilaterales  son  más  conservadores  que  los  unilaterales,  ya  que  para  un 
mismo  valor  del  estadístico  de  prueba,  el  valor-p  es  mayor  para  un  test  bilateral 
que  para  un  test  unilateral. 


Podemos  resumir  lo  que  hemos  visto  sobre  tests  para  la  media  /r  de  la  siguiente  manera: 

RESUMEN  6.1 


Para  la  m.a.  Xi,X2,  ■  ■  ■  ,Xn  con  distribución  normal  con  ero  conocido. 

Hipótesis  nula 

H0  :  /i  =  Mo 

Valor  del  estadístico 

de  prueba 

y/ñ(x-  Ho) 

z  = - 

00 

Hipótesis  alternativa 

Ha  :  h  <  no 

Ha  ■  n  >  /r0 

Ha  :  n  /  Mo 

Región  de  rechazo  con 

nivel  a 

z  <  —za 

z  >  za 

M  >  2a/2 
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EJERCICIO  6.1 

Se  extrajo  una  m.a.  de  16  informes  de  urgencias  de  los  archivos  de  un  servicio  de  ambulancias. 
El  tiempo  medio  para  que  las  ambulancias  llegaran  a  sus  destinos  fue  de  13  min.  Suponga  que  la 
población  de  tiempos  sigue  una  distribución  normal  con  varianza  9.  ¿Es  posible  concluir,  con  un 
nivel  de  significancia  de  0.05,  que  la  media  de  la  población  es  menor  que  10  min? 


Test  de  hipótesis  para  la  media  de  una  distribución  normal 
con  varianza  desconocida 


Cuando  la  distribución  de  los  datos  es  normal,  pero  desconocemos  el  valor  de  er,  no  podemos 
usar  el  mismo  estadístico  de  prueba  que  en  el  caso  anterior.  Recordemos  lo  que  vimos  al  construir 
intervalos  de  confianza,  en  ese  caso  usamos  una  función  pivote  con  distribución  de  Student.  En  el 
caso  de  un  test,  cuando  ¿t  =  ¿¿o,  el  estadístico: 


X  —  flQ 

S/y/Ü 


tiene  distribución  de  Student  con  n  —  1  grados  de  libertad.  Usaremos  entonces  este  estadístico  de 
prueba,  del  mismo  modo  que  antes  usamos  el  Z. 


Ejemplo  6.3 


El  zooplancton  se  compone  de  todos  los  animales  oceánicos  que  se  dejan  arrastrar  pasivamente 
por  el  movimiento  del  agua.  Se  extrajeron  9  muestras  de  agua  en  las  proximidades  de  una  isla, 
se  determinó  el  número  de  individuos  por  m3  y  se  obtuvieron  los  siguientes  valores: 

5000  5700  4450  4500  4825  4025  3700  4900  3750 

Suponemos  que  el  número  de  individuos  por  to3  de  agua  está  normalmente  distribuido. 

El  investigador  sospecha,  por  tener  experiencia  en  el  tema,  que  en  esa  zona  la  cantidad  media 
de  zooplancton  por  m 3  de  agua  supera  los  4200  individuos  y  quiere  verificar  esa  teoría.  ¿Proveen 
los  datos  suficiente  evidencia  para  apoyar  esta  suposición?  Usar  a  =  0.05. 

El  modelo  en  este  ejemplo  es:  X-¡ .  X2,  ■  ■  ■ ,  Xg  una  m.a.  donde  cada  X.¿  es  el  número  de 
individuos  por  to3  de  agua  de  la  muestra  i,  con  i  =  1, . . . ,  9.  Suponemos  que  las  tienen 
distribución  N(/i,  a2).  Podemos  enunciar  el  problema  como: 

Hq  :  p  =  4200  vs.  Ha  ■  /i  >  4200 

Como  no  conocemos  la  varianza  usaremos  el  siguiente  estadístico  de  prueba: 

_  X  -  4200 

S/V9 
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que,  bajo  el  modelo  supuesto  y  cuando  la  hipótesis  nula  Hq  es  verdadera,  tiene  distribución  de 
Student  con  n—  1  =  8  grados  de  libertad.  Luego,  se  puede  definir  la  regla  de  decisión  del  siguiente 
modo: 


rechazar  Hq  :  p  =  4200  a  favor  de  Ha  :  p  >  4200 
cuando  t  >  t0  05  S, 


Se  busca  en  la  Tabla  de  Student  para  8  grados  de  libertad,  resulta  fo.05,8  =  1-8595.  Esto 
significa  que  la  región  de  rechazo  está  a  la  derecha  de  1.86.  Reemplazando  por  los  valores  de  la 
media  muestral  x  =  4538.9  y  la  desviación  típica  muestral  s  =  649.29,  calculamos  el  valor  del 
estadístico  y  obtenemos  t  =  3(4538.9  —  4200)/649.29  =  1.566.  Este  valor  no  cae  en  la  región 
de  rechazo,  entonces  no  podemos  afirmar  a  nivel  0.05  que  el  número  medio  de  individuos  de  la 
población  de  zooplancton  sea  mayor  que  4200  por  m3. 

Como  no  tenemos  una  tabla  que  nos  permita  calcular  la  probabilidad  P{T  >  1.566),  no 
podemos  calcular  exactamente  el  valor-p,  pero  teniendo  en  cuenta  que  es  el  mínimo  nivel  de 
significación  con  el  que  rechazamos  Hq  con  los  datos  observados,  ya  podemos  afirmar  que  valor- 
p  >  0.05  (ya  que  con  nivel  a  =  0.05  no  pudimos  rechazar  Hq),  entonces  vemos  si  es  posible 
rechazar  H0  con  un  nivel  menos  exigente.  Podemos  ver  en  la  Tabla  de  Student  con  8  grados  de 
libertad  que  el  valor  crítico  correspondiente  a  a  =  0.08  es  1.5489  esto  significa  que  con  nivel  0.08 
podemos  rechazar  H0l  entonces  el  valor-p  <  0.08.  Resumiendo  0.05  <  valor-p  <  0.08,  como  se 
muestra  en  la  siguiente  gráfica. 


Ejemplo  6.4 


Volviendo  a  la  situación  de  determinar  si  un  método  de  medición  tiene  error  sistemático,  consi¬ 
deremos  un  ejemplo  más  realista  donde  no  se  conoce  el  desvío  estándar.  Se  hacen  10  determina¬ 
ciones  del  contenido  de  níquel  para  una  aleación  estándar  preparada  de  modo  que  se  conoce  el 
verdadero  valor  del  contenido,  que  es  4.44  %.  Se  obtienen  los  siguientes  valores: 

4.32  4.31  4.50  4.12  4.43  4.36  4.48  4.28  4.18  4.42 

La  pregunta  que  nos  formulamos  es:  ¿con  estos  10  datos  podemos  afirmar  que  el  método  de 
medición  tiene  error  sistemático? 

Tenemos  una  m.a.  Xi,X2,  ■  ■  . ,  A'io,  donde  X,  es  la  í-ésima  determinación  del  contenido  de 
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níquel  en  la  aleación,  y  suponemos  que  las  X,¡:  tiene  distribución  N(n,  cr2),  si  el  método  no  tiene 
error  sistemático,  la  media  es  igual  al  verdadero  valor.  Las  hipótesis  a  contrastar  en  este  caso 
son: 


H0  :  [i  =  4.44  vs.  Ha  '■  [i-  ^  4.44, 


el  estadístico  de  prueba  es: 


T  = 


X  -  4.44 
S/y/lÓ 


que  tiene  distribución  de  Student  con  9  grados  de  libertad  cuando  HQ  es  verdadera.  Luego,  la 
zona  de  rechazo  con  nivel  a  =  0.05  es: 


|t|  >  ¿0.025,9  =  2.2622 

i 

k 

— ^0.025,9  0 

Í0.025T9 

Haciendo  los  cálculos  se  obtiene:  x  =  4.34  y  s  =  0.1243  y  reemplazando  en  la  fórmula  del 
estadístico  de  prueba,  se  obtiene:  t  =  —2.5441.  Vemos  que  el  valor  del  estadístico  de  prueba  cae 
en  la  región  de  rechazo,  y  en  consecuencia,  podemos  afirmar  con  nivel  a  =  0.05  que  el  método 
tiene  error  sistemático. 

Como  hemos  rechazado  Hq  con  a  =  0.05,  sabemos  que  valor-p  <  0.05.  Podemos  ver  si  aún 
rechazamos  con  un  nivel  más  exigente.  Si  eligiéramos  a  =  0.02,  el  valor  crítico  es  ¿o.oi,9  =  2.8214 
y  por  lo  tanto  el  valor  observado  t  =  —2.5441  no  cae  en  la  correspondiente  región  de  rechazo, 
entonces  valor-p  >  0.02.  Es  decir: 

0.02  <  valor-p  <0.05 


Podemos  resumir  los  diferentes  tests  para  la  media  /i  de  la  siguiente  manera: 


RESUMEN  6.2 


Para  la  m.a.  X\ ,  X2,  ■  ■  ■ ,  Xn  con  distribución  normal  con  <7  desconocido. 

Hipótesis  nula 

Hq  :  ¡i  —  no 

Valor  del  estadístico 

de  prueba 

O 

II 

-to 

Hipótesis  alternativa 

Ha  ■■  n  <  no 

Ha  :  n  >  no 

Ha  ■  H  ±  úo 

Región  de  rechazo  con 

nivel  a 

t  ^  toí,n— 1 

t  tcy,n— 1 

1^1  ''>  ^<y./2,n—l 
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EJERCICIO  6.2 

Los  siguientes  datos  son  medias  de  consumo  de  oxígeno  (en  mi)  durante  la  incubación  de  una  m.a. 
de  14  suspensiones  celulares: 

14.0  14.1  14.5  13.2  11.2  14.1  12.2  11.1  13.7  13.2  16.0  12.8  14.4  12.9  ¿Pro¬ 

porcionan  estos  datos  suficiente  evidencia,  en  un  nivel  de  significación  de  0.05,  de  que  la  media  del 
consumo  de  oxígeno  es  menor  a  14  mi?,  ¿qué  supuestos  se  deben  cumplir? 


Test  de  hipótesis  para  la  media  de  una  distribución 
desconocida  (muestras  grandes) 


Del  mismo  modo  que  en  la  construcción  de  un  intervalo  de  confianza,  cuando  no  conocemos 
la  distribución  de  los  datos,  si  la  muestra  es  suficientemente  grande,  podemos  utilizar  el  Teorema 
Central  del  Límite. 


Ejemplo  6.5 


Recordemos  el  Ejemplo[5]14.  ¿Se  puede  afirmar,  en  base  a  estos  datos,  que  los  peces  de  esa  región 
tienen  niveles  medios  de  zinc  mayores  a  8.2  gg/g ? 

Aquí  tenemos  una  m.  a.  X\ ,  X'¿. . . . ,  X^q  donde  cada  X,  es  la  concentración  de  zinc  en  el 
hígado  ( gg/g )  del  i-ésimo  pez  examinado  y  desconocemos  su  distribución,  pero  suponemos  que 
tiene  media  g  =  E(Xi)  y  varianza  er2  =  V(Xi). 

El  problema  puede  plantearse  como: 

H0  :  g  =  8.2  vs.  Ha  ■  g  >  8.2 

y  en  este  caso,  como  n  es  grande,  podemos  aplicar  el  resultado  del  Teorema  Central  del  Límite 
y  usar  el  estadístico  de  prueba: 

O 

ya  que,  según  este  teorema,  cuando  g  =  8.2  tiene  una  distribución  aproximadamente  _/V(0, 1). 
Entonces  podemos  definir,  como  siempre,  una  regla  de  decisión: 

rechazar  H0  :  g,  =  8.2  a  favor  de  Ha  '■  g  >  8.2  cuando  z  >  za 
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con  los  datos  del  ejemplo,  x  =  9.15  gg/g  y  s  =  1.27  gg/g,  reemplazando  en  el  estadístico, 
obtenemos  un  valor  z  =  \/56  (9.15  —  8.2)/1.27  =  5.598,  vemos  en  la  Tabla  de  la  distribución 
Normal  que  el  valor-p  =  P(Z  >  5.598)  <  0.0001,  esto  significa  que  hay  muy  fuerte  evidencia  para 
rechazar  H$,  y  se  puede  rechazar  con  cualquier  nivel  de  significación  razonable.  O  sea,  podemos 
concluir  que  la  concentración  media  de  zinc  en  el  hígado  de  los  peces  de  esa  región  es  superior 
a  8.2  gg/g. 


Podemos  resumir  los  casos  de  tests  para  la  media  de  una  distribución  desconocida,  cuando  n 
es  grande,  de  la  siguiente  manera: 


RESUMEN  6.3 


Para  la  m.a.  V-j ,  X<¿. . . . ,  Xn  con  distribución  desconocida  y  n  grande. 

Hipótesis  nula 

H0  :  g  —  g0 

Valor  del  estadístico 

de  prueba 

y/ñ(x-  g0) 

z  = - 

s 

Hipótesis  alternativa 

Ha  :  g  <  g0 

Ha  ■  g  >  go 

Ha  :  g  go 

Región  de  rechazo  con 

nivel  aproximado  a 

z  <  —za 

z  >  za 

M  >  Za/ 2 

Observación: 

En  este  caso  el  nivel  es  aproximado,  porque  no  conocemos  la  distribución  exacta 
del  estadístico  de  prueba  y  estamos  utilizando  una  aproximación. 


EJERCICIO  6.3 

En  una  muestra  de  49  adolescentes  que  se  prestaron  como  sujetos  para  un  estudio  inmunológico, 
una  variable  de  interés  fue  la  prueba  del  diámetro  de  reacción  de  la  piel  a  un  antígeno.  La  media  y 
la  desviación  estándar  de  la  muestra  fueron  de  21  y  11  mm,  respectivamente.  ¿Es  posible  concluir 
a  partir  de  estos  datos  que  la  media  poblacional  es  diferente  a  30?  Tomar  a  =  0.01. 
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Test  de  hipótesis  para  una  proporción 


Ya  vimos  al  tratar  el  tema  intervalo  de  confianza  para  una  proporción,  en  el  Capítulo  5,  que  si 
tenemos  una  v.a.  X  con  distribución  B(n,p)  entonces,  si  n  es  suficientemente  grande,  la  distribución 
de: 


Z  = 


P~P 

p(i-p) 


es  aproximadamente  N( 0, 1)  por  el  Teorema  Central  del  Límite. 


Ejemplo  6.6 


Una  de  las  célebres  leyes  de  Murphy  establece  que  si  se  deja  caer  al  suelo  una  tostada  untada 
con  dulce,  la  probabilidad  de  que  caiga  del  lado  del  dulce  es  mayor  que  la  de  que  caiga  del  lado 
del  pan.  Para  verificarla,  se  realizó  un  experimento:  se  dejaron  caer  1000  tostadas  untadas  con 
mermelada,  de  las  cuales  540  cayeron  del  lado  del  dulce.  ¿Qué  podría  concluir  a  nivel  a  =  0.05? 

Para  modelizar  este  problema  definimos  X=  “el  número  de  tostadas  que  caen  del  lado  del 
dulce,  entre  las  1000  del  experimento”.  Esta  v.a.  tiene  distribución  ??(1000,p),  según  la  ley  de 
Murphy  este  valor  de  p  es  mayor  que  0.5.  Entonces,  para  verificar  esta  ley  planteamos  el  siguiente 
test: 


Hq  :  p  =  0.5  vs.  Ha  :  p  >  0.5 


Si  H0  es  verdadera  (p  =  0.5),  según  el  TCL, 


Z  = 


p  —  0.5 

0. 5(1-0. 5) 
1000 


tiene  distribución  aproximadamente  N( 0, 1),  este  será  nuestro  estadístico  de  prueba. 
Si  usamos  un  nivel  a  =  0.05,  la  regla  de  decisión  será: 


rechazar  Hq  :  p  =  0.5  a  favor  de  Ha  :  p  >  0.5  cuando  z  >  zq. 05  =  1.645 


En  el  experimento  se  obtuvo  p  =  0.54,  reemplazando  en  el  estadístico  de  prueba  se  obtiene 
z  =  2.53,  que  cae  en  la  zona  de  rechazo.  Conclusión,  en  base  a  este  experimento,  podemos  afirmar 
(con  nivel  0.05)  que  la  ley  de  Murphy  es  verdadera. 

Si  queremos  conocer  el  valor-p,  calculamos  P(Z  >  2.53)  =  1  —  $(2.53)  =  0.0057.  Esto  significa 
que  podemos  afirmar  que  esta  ley  de  Muphy  es  verdadera  con  cualquier  nivel  >  0.0057. 
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Podemos  resumir  los  casos  de  tests  para  una  proporción  como  sigue: 


RESUMEN  6.4 


Para  la  v.a.  X  con  distribución  B(n,p)  y  n  grande. 

Hipótesis  nula 

^3 

II 

0 

Valor  del  estadístico 

P~Po 

7.  —  - 

de  prueba 

/  Po(l-Po) 

Hipótesis  alternativa 

HA:p  <Po 

Ha  :  p  >  Po 

ha-p¥=po 

Región  de  rechazo  con 

z  <  —za 

z  >  za 

M  >  Za/2 

nivel  aproximado  a 

Observación: 

En  este  caso  también  el  nivel  es  aproximado,  porque  no  conocemos  la  distribu¬ 
ción  exacta  del  estadístico  de  prueba  y  estamos  utilizando  una  aproximación. 


EJERCICIO  6.4 

En  un  estudio  se  encontró  que  66  %  de  los  niños  en  una  muestra  de  670  completaron  toda  la 
serie  de  vacunas  contra  la  hepatitis  B.  ¿Es  posible  concluir  que,  con  base  a  estos  datos,  en  la 
población  muestreada,  más  del  60  %  tienen  la  serie  completa  de  vacunas  contra  la  hepatitis 
B?  Tomar  a  =  0.01. 

2,  En  una  investigación  de  consumidores  de  drogas  intravenosas  en  una  ciudad  grande,  encon¬ 
traron  a  18  de  423  individuos  con  HIV  positivo.  Se  pretende  saber  si  es  posible  concluir  que 
los  consumidores  de  drogas  intravenosas  en  la  población  muestreada  tienen  HIV  positivo  en 
un  porcentaje  diferente  del  5  %. 


Test  de  hipótesis  para  la  varianza  de  una  distribución  normal 


Cuando  hicimos  intervalos  de  confianza  para  la  varianza  ya  vimos  que,  para  la  m.a.  X\,  X2, . . . ,  Xn 
con  distribución  normal,  la  función: 


V  = 


(n  —  1)  S2 

n-2 
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tiene  distribución  Chi-cuadrado  con  n  —  1  grados  de  libertad.  Si  tenemos  una  distribución  normal 
y  queremos  hacer  un  test  para  la  varianza,  usaremos  como  estadístico  de  prueba  esa  función 
reemplazando  a2  por  el  valor  de  la  hipótesis  nula. 


Ejemplo  6.7 


Consideremos  el  ejemplo  del  método  de  medición  del  contenido  de  níquel,  Ejemplo  6.4.  Si  se 
supone  que  un  valor  aceptable  de  a  debe  ser  menor  que  0.3,  ¿podemos  afirmar  que  el  método  es 
aceptable  con  a  =  0.05? 

Ya  dijimos  que  las  10  determinaciones  son  v.a.  con  distribución  N(fi,  a2).  El  problema  puede 
plantearse  como: 

H0:a2  =  0.32  vs.  HA  :  a2  <  0.32 


El  estadístico  de  prueba  será: 


V  = 


9  xS2 
0.32 


que  tiene  distribución  Chi-cuadrado  con  9  grados  de  libertad  si  H0  es  verdadera.  La  regla  de 
decisión  es: 


rechazar  H0  :  a2  =  0.32  a  favor  de  HA  :  a2  <  0.32 
si  u  <  Xo.95,9  =  3.3251 


3.3251 


En  este  caso,  el  valor  del  estadístico  de  prueba  es  v  =  1.5451  que  cae  en  la  zona  de  rechazo 
de  nivel  0.05.  Esto  significa  que  podemos  afirmar,  con  nivel  0.05,  que  el  desvío  estándar  del  error 
de  medición  es  aceptable. 


Podemos  resumir  los  casos  de  tests  para  la  varianza  de  una  distribución  normal  como  sigue: 


RESUMEN  6.5 


Para  la  m.a.  X\,  , . . . ,  Xn  con  distribución  normal  con  a  desconocido. 

Hipótesis  nula 

Hq  :  a2  =  a2 

Valor  del  estadístico 

de  prueba 

(n  —  1)  s2 

V  =  2 

Hipótesis  alternativa 

HA:  a2  <  al 

HA  :  a2  >  al 

Ha  :  a  2  al 

Región  de  rechazo  con 

nivel  a 

^  <  Xl—a,n—l 

V>Xl/2,n-l  6 

V  <  X?_a/2l„-l 
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EJERCICIO  6.5 


Se  registraron  los  valores  de  la  capacidad  vital  de  una  muestra  de  10  pacientes  con  obstrucción 
crónica  severa  de  las  vías  respiratorias.  La  varianza  de  las  10  observaciones  fue  de  0.75. 
Pruebe  la  hipótesis  nula  que  indica  que  la  varianza  de  la  población  es  de  1.  Con  a  =  0.05. 
¿Qué  supuestos  deben  hacerse? 

2  En  un  estudio  realizado  en  15  pacientes  con  enfermedad  sarcoide  pulmonar,  se  midieron  las 
concentraciones  de  gases  en  la  sangre.  La  varianza  de  los  valores  de  PaO 2  (en  mmHg)  fue 
de  450.  Pruebe  la  hipótesis  alternativa  según  la  cual  la  varianza  de  la  población  es  mayor 
que  250.  Con  a  =  0.05. 
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CAPITULO  7 


Inferencias  basadas  en  dos  muestras 


Introducción 

En  el  capítulo  anterior  vimos  tests  para  comparar  la  media  de  una  población  con  un  valor 
fijo  /t0.  Sin  embargo,  en  la  mayoría  de  las  aplicaciones,  interesa  comparar  dos  poblaciones.  Por 
ejemplo,  para  evaluar  el  efecto  de  un  nuevo  tratamiento,  se  suele  comparar  un  grupo  de  individuos 
al  que  se  aplica  el  nuevo  tratamiento  con  otro  grupo  al  que  se  le  aplica  otro  tratamiento  o  un 
placebo;  en  otros  casos  se  comparan  individuos  expuestos  a  un  factor  de  riesgo  con  otros  que  no  lo 
están,  o  se  desea  comparar  los  resultados  de  dos  métodos  de  medición,  etc. 

Los  procedimientos  para  construir  intervalos  de  confianza  para  la  diferencia  de  medias  y  realizar 
tests  para  comparación  de  medias,  son  similares  a  los  que  vimos  antes.  Lo  principal  es  encontrar 
la  función  pivote  y  el  estadístico  de  prueba  adecuado  para  cada  situación. 


Intervalo  de  confianza  y  test  para  la  diferencia  de  medias  de 
dos  poblaciones  normales  con  varianzas  conocidas 

Sean  Xlt  X2, . . . ,  Xni  una  m.a.  de  una  distribución  N(ni,af)  e  Yí,  Y2, . . . ,  Yn2  una  m.a.  de  una 
distribución  7V(/i 2,02),  independientes  entre  sí  y  con  varianzas  conocidas. 

Un  estimador  insesgado  para  la  diferencias  de  las  medias,  /-ti  —  /¿2,  es  X  —  Y  y  sabemos  que 
X  —  Y  tiene  distribución  N(/i  1  —  /¿2,  o\¡n\  +  02/712),  entonces  si  deseamos  construir  un  intervalo 
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de  confianza  para  gi  —  ¡x2,  la  función  pivote  será: 


Z  = 


X  —  Y  —  (/n  —  g2) 


que  tiene  distribución  7V( 0, 1).  Y  el  intervalo  de  confianza  para  gi  —  g,2  resultará: 


ICa(ni  —  g2) 


a?  —  _ 

— i  x  —  y  +  za/ 2 

n2 


x 


Ejemplo  7.1 


A  un  equipo  de  investigación  le  interesa  conocer  la  diferencia  entre  las  concentraciones  de  áci¬ 
do  úrico  en  pacientes  con  y  sin  una  determinada  enfermedad.  En  un  hospital  especializado 
para  el  tratamiento  de  esa  enfermedad,  una  muestra  de  12  pacientes  presenta  una  media  de 
4.5  mg/ 100  mi.  En  un  hospital  general  se  encontró  que  una  muestra  de  15  individuos  sin  esta 
enfermedad  de  la  misma  edad  y  sexo  presenta  un  nivel  medio  de  3.4  mg/ 100  mi.  Si  es  razonable 
suponer  que  las  dos  poblaciones  de  valores  muestran  una  distribución  normal  y  sus  varianzas  son 
iguales  a  1  y  1.5,  respectivamente,  calculemos  el  intervalo  de  confianza  de  95  %  para  la  diferencias 
de  medias. 

Primero  modelicemos  el  problema.  Sea  X\ ,  X2 , . . . ,  X\2  una  m.a.  con  cada  ~  N ,  1) ,  que 
indica  el  nivel  de  ácido  úrico  en  el  paciente  i  (medido  en  mg/ 100  mi)  con  la  enfermedad.  Además 
tenemos  Yi,Y2,  . . . ,  Y 5  una  m.a.  con  cada  Yj  ~  N(g 2, 1.5),  que  indica  el  nivel  de  ácido  úrico  en 
el  paciente  j  (medido  en  mg/ 100  mi)  sin  la  enfermedad.  Las  v.a.  y  Yj  son  independientes. 

Entonces  tenemos  que  x  =  4.5,  y  =  3.4  y  20.025  =  1-96,  así  el  intervalo  que  deseamos  es: 

/C0.95(mi  -  A*  2)  =  4.5  -  3.4  ±  1.96  x  |  =  (0.2608, 1.9392) 

Esto  significa  que  tenemos  el  95%  de  confianza  de  que  la  diferencia  real  yi  —  g2:  está  entre 
0.2608  y  1.9392.  Recordemos  la  interpretación  de  intervalo  de  confianza  vista  en  el  Capítulo  [5] 


Si  deseamos  contrastar  hipótesis  sobre  gi  —  g2,  donde  Hq  :  gi  —  g2  =  Ao  debemos  usar  el 
estadístico  de  prueba: 


X  —  Y  —  A 


o 


£7 


2 

2_ 


n2 


que  tiene  distribución  N( 0, 1)  cuando  Hq  es  verdadera.  Entonces  el  resumen  para  los  tests  de 
hipótesis  para  gi  —  g,2  será: 
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RESUMEN  7.1 


Para  las  m.a.  X±,X' 

, . . . ,  Xni  con  distribución  N(n  1,  a\)  e  Yi,  Y2, . . . ,  Yn2  con 

distribución  independientes  entre  sí. 

Hipótesis  nula 

Ho  ■  Mi  —  ¿*2  —  Aq 

Valor  del  estadístico 

x-y-  A0 

de  prueba 

A  ^ 

V  ni  712 

Hipótesis  alternativa 

Ha  '■  Mi  —  M2  <  A0 

Ha  '■  Mi  —  k-2  >  Ao 

Ha  '■  Mi  —  M2  7^  A0 

Región  de  rechazo  con 

nivel  a 

2  <  —  za 

z  >  za 

\z\  >  -a/2 

En  muchas  situaciones  sólo  interesa  saber  si  las  inedias  de  las  dos  poblaciones  son  diferentes, 
en  ese  caso  A0  =  0. 


Ejemplo  7.2 


Se  realizó  un  estudio  para  determinar  la  resistencia  a  la  ruptura  de  dos  tipos  de  acero.  Para  una 
muestra  aleatoria  formada  por  20  especímenes  de  acero  laminado  en  frío  la  resistencia  promedio 
muestral  fue  x  =  29.8  ksi.  Al  estudiar  una  segunda  muestra  aleatoria  de  25  especímenes  de  acero 
galvanizado  de  dos  lados  se  obtuvo  una  resistencia  promedio  muestral  y  =  32.7  ksi.  Se  supone 
que  las  distribuciones  de  la  resistencia  a  la  ruptura  de  los  dos  tipos  de  acero  son  normales  con 
(Ti  =  4,  para  el  acero  laminado  en  frío,  y  ct2  =  5  para  el  acero  galvanizado.  ¿Indican  los  datos 
que  las  inedias  de  resistencia  a  la  ruptura  son  diferentes  para  los  dos  tipos  de  acero? 

Modelizando:  tenemos  Xi ,  X2 , . . . ,  X2q  una  m.a.  de  una  16)  e  Y),  Y¿, . . . ,  Y25  una  m.a. 

de  una  distribución  N(/i 2, 25),  independientes  entre  sí.  Cada  X.¡  indica  la  resistencia  a  la  ruptura 
del  i-ésimo  espécimen  de  acero  laminado  en  frío  y  cada  Y)  Ia  resistencia  a  la  ruptura  del  j-ésimo 
espécimen  de  acero  galvanizado.  En  este  caso  el  problema  se  plantea  como: 

H0  :  Mi  =  2  vs.  Ha  :  ¿¿1  ¿¿2 

o  en  forma  equivalente 

H0  :  ¿ti  -  y.2  =  0  vs.  Ha  :  ¿íi  -  ¿í2  ^  0 


Para  este  problema  el  estadístico  de  prueba  será: 


Z  = 


X-Y- 0 


25 

25 


que  tiene  distribución  1V(0, 1),  cuando  Hq  es  verdadera,  y  la  regla  de  decisión  es: 


rechazar  H0  si  el  valor  \z\ 
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Si  elegimos  un  nivel  de  significación  a  =  0.05,  el  punto  crítico  será  za/ 2  =  1.96.  Entonces, 
reemplazando  con  los  valores  muéstrales  vemos  que  en  este  caso  el  valor  del  estadístico  de 
prueba  es:  2  =  —2.16,  que  cae  en  la  zona  de  rechazo.  Por  lo  tanto,  podemos  concluir  que 
para  un  nivel  0.05,  afirmamos  que  las  medias  de  resistencia  a  la  ruptura  difieren  para  los  dos 
tipos  de  acero. 

Si  calculamos  el  valor-p: 

valor-p  =  P(\Z\  >  |  -  2.16|)  =  1  -  P(\Z\  <  2.16)  =  1  -  P(  -  2.16  <  Z  <  2.16) 


=  1  -  [$(2.16)  -  $(-2.16)]  =  2  x  (1  -  0.9846)  =  0.0308 

esto  significa  que,  hasta  con  un  nivel  0.0308,  podemos  afirmar  que  la  resistencia  a  la  ruptura  de 
los  dos  tipos  de  acero  es  diferente. 


EJERCICIO  7.1 

Veinticuatro  animales  de  laboratorio  con  deficiencia  de  vitamina  D  fueron  divididos  en  2  grupos 
iguales.  El  grupo  1  recibió  un  tratamiento  consistente  en  una  dieta  que  proporcionaba  vitamina 
D.  Al  segundo  grupo  no  se  le  administró  tratamiento.  Al  término  del  periodo  experimental,  se 
midieron  las  concentraciones  de  calcio  en  suero,  obteniéndose  los  siguientes  resultados: 


Grupo 

Media  muestral 

Con  tratamiento 

11.1  mg/ 100  mi 

Sin  tratamiento 

7.8  mg/ 100  mi 

Considerar  que  las  poblaciones  siguen  una  distribución  normal  con  <ji  =  1.5  y  02  =  2. 

1.  Construir  el  intervalo  de  confianza  para  la  diferencia  de  medias  con  nivel  del  98%. 

2.  ¿Sugieren  los  datos  que  la  concentración  media  de  calcio  en  suero  en  el  grupo  tratado  es 
superior  en  más  de  2  mg/ 100  mi  con  respecto  al  grupo  sin  tratar?  Formule  y  pruebe  las 
hipótesis  apropiadas  utilizando  un  nivel  de  significación  de  0.05. 
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Pero  no  siempre  que  tenemos  dos  muestras  aleatorias  de  distribuciones  normales,  conocemos 


sus  varianzas.  Veamos  ahora  este  caso. 


Intervalo  de  confianza  y  test  para  la  diferencia  de  medias  de 
dos  poblaciones  normales  con  varianzas  desconocidas  pero 
iguales 


Sean  dos  m.a.  Xi,  X2, . .  ■ ,  Xni  con  distribución  N(iii,a2)  e  Y),  Y2, . . . ,  Yn2  con  distribución 
-^r(Aí2Jcr2)  e  independientes  entre  sí,  con  varianzas  desconocidas  pero  iguales. 

Sabemos  que  X  —  Y  es  un  estimador  razonable  para  la  diferencias  de  las  medias,  /xi  —  /x2,  y 
cuando  las  V¿  y  las  Y,¡  tienen  distribución  normal  y  son  muestras  independientes,  X  —  Y  tiene 
distribución  normal  con 


E(X  -Y)  =  m  -/i2  y  Var{X  -  Y)  =  —  +  —  =  a2  [  —  +  — 


n  1  n2 


1 


1 


ni 


n  2 


entonces  la  función: 


z  _  X  -  Y  -  (/n  -  /J2) 

tiene  distribución  ÍV(0, 1),  pero  dado  que  no  conocemos  a  debemos  reemplazarlo  por  un  estimador. 
Para  este  caso  usaremos  el  estimador  ponderado  de  la  varianza  que  se  define  como: 


X^-*)2  +  go Vi -Y? 


c2  _  i= 1 

Dp 


i=  1 


(ni  -  1  )Sf  +  (n2  -  1  )Sf 


(7.1) 


ni  +  n2  -  2  ni  +  n2  -  2 

que  es  insesgado  y  usaremos  Sp  =  como  estimador  de  <7.  Luego,  si  reemplazamos  er  por  Sp, 
obtenemos  la  función  pivote: 


T  = 


X -Y -(y  1  -  n  2) 
SP  \/m  +  ~k 


que  tiene  distribución  de  Student  con  ni+n2  — 2  grados  de  libertad.  Luego  el  intervalo  de  confianza 
de  nivel  1  —  a  es: 


^2)  X  1  i  ^a/2,ni+ri2— 2  ^ p 


1 

n2 


Ejemplo  7.3 


El  objetivo  de  un  estudio  de  aptitud  física  fue  determinar  los  resultados  del  ejercicio  por  un 
tiempo  prolongado  en  los  ejecutivos  de  una  compañía  inscriptos  en  un  programa  supervisado 
de  acondicionamiento  físico.  Se  registraron  datos  de  13  individuos  (el  grupo  deportista)  que 
voluntariamente  se  inscribieron  al  programa  y  que  permanecieron  activos  por  13  años 
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en  promedio,  y  de  17  individuos  (el  segundo  grupo,  el  sedentario)  que  decidieron  no 
inscribirse.  Entre  los  datos  que  se  registraron  acerca  de  los  individuos  está  el  número  máximo 
de  sentadillas  realizadas  en  30  segundos.  El  grupo  deportista  obtuvo  una  media  y  una  desviación 
estándar  de  21  y  4.9,  respectivamente.  La  media  y  desviación  estándar  para  el  grupo 
sedentario  fueron  12.1  y  5.6  respectivamente.  Se  considera  que  las  dos  poblaciones  de  mediciones 
de  acondicionamiento  muscular  siguen  una  distribución  aproximadamente  normal,  y  que 
las  varianzas  para  ambas  poblaciones  son  iguales.  Se  pretende  elaborar  un  intervalo 
del  98  %  para  la  diferencias  entre  las  medias  de  las  poblaciones  representadas  por  las  dos  mues¬ 
tras. 

Primero  modelicemos  el  problema.  Tenemos  dos  grupos  de  m.a.:  el  primero  son  X\ ,  X2 . . . . , 
X13  con  cada  X,  ~  ÍV(/xi,  er2),  que  indica  el  número  máximo  de  sentadillas  realizadas 
en  30  segundos  por  el  individuo  i  del  grupo  deportista;  y  el  segundo  son  Y),  Y2,  •  ■  • ,  Ti 7 
con  cada  Yj  ~  N(fj,2,  o’2),  O116  indica  el  número  máximo  de  sentadillas  realizadas  en  30  segundos 
por  el  individuo  j  del  grupo  sedentario.  Las  v.a.  X.¿  e  Yj  son  independientes. 

Entonces  tenemos  que  x  =  21,  y  =  12.1,  s2  =  4.92  y  s\  =  5.62.  Calculemos  el  valor  de  S2 
observado: 

„2  _  (m  -  l)s2  +  (n2  -  l)s2  _  (13  -  1)  x  4.92  +  (17  -  1)  x  5.62  _  01 

p  m+n2-  2  13  +  17-2 

es  decir,  sp  =  5.3113.  Consultando  la  Tabla  de  la  distribución  Student  con  13  +  17  -  2  =  28 
grados  de  libertad  con  un  nivel  de  confianza  de  98%,  se  observa  que  el  valor  crítico  es  2.4671. 
Por  lo  tanto,  el  intervalo  de  confianza  de  98  %  para  la  diferencia  de  las  medias  poblacionales  se 
obtiene  de  la  siguiente  manera: 

^0.98 (aíi  ~  Ata)  =  21  -  12.1  ±  2.4671  x  5.3113  ^ ^  ^  =  (4.0722, 13.7278) 

Se  tiene  una  confianza  del  98  %  de  que  la  diferencia  entre  las  medias  de  las  poblaciones  están 
entre  4.0722  y  13.7278. 


Si  deseamos  realizar  algún  test  sobre  /¿i  —  ¡i2,  el  estadístico  de  prueba  será: 

^  X-Y- A0 


que  bajo  la  hipótesis  nula,  Hq  :  /ii  —  fi2  =  Ao,  tiene  distribución  de  Student  con  ni  +  n2  —  2  grados 
de  libertad.  Resumimos  entonces  los  tests  de  comparación  de  medias: 
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RESUMEN  7.2 


Para  las  m.a.  Xi,  X2, . . . ,  Xni  con  distribución  N(yi,a2)  e  Yí,  Y2, . . . ,  Yn2  con 
distribución  N(y2,cr2),  independientes  entre  sí. 

Hipótesis  nula 

Hq  ■  yi  —  y2  —  Ao 

Valor  del  estadístico 

de  prueba 

x-y-  A0 
sp  \Jh  +  ~k 

Hipótesis  alternativa 

Ha  :  yi  —  y2  <  A0 

Ha  :  yi  —  y2  >  A0 

Ha  '■  yi  —  M2  Y 

Región  de  rechazo  con 

nivel  a 

t  ^  ^a,ni+n2- 2 

t  ^  ^a,ni+íi2- 2 

1^1  ^a/2,ni +712—2 

Ejemplo  7.4 


Se  desea  verificar  si  hay  diferencia  en  el  nivel  medio  de  hierro  en  sangre,  entre  los  niños  con  fibrosis 
quística  y  los  niños  sanos.  Se  seleccionaron  9  niños  con  fibrosis  quística  y  se  les  realizaron  las 
mediciones  de  hierro  en  sangre,  obteniéndose  x  =  11.9  ymol/l  y  si  =  6.3  ymol/l.  También  se 
realizaron  mediciones  de  hierro  en  sangre  sobre  de  una  muestra  de  13  niños  sanos,  obteniéndose 
y  =  18.9  ymol/l  y  s2  =  5.9  ymol/l.  Asumimos  que  la  distribución  de  los  valores  de  hierro  en 
ambas  poblaciones  es  normal  con  igual  varianza. 

Modelizando:  tenemos  X2,  .  ■  ■ ,  Xg  una  m.a.  con  cada  ~  N(y±,a2),  que  indica  el 
nivel  de  hierro  en  sangre  del  niño  i  con  fibrosis  quística  (medido  en  ymol/l).  Además  tenemos 
Yi .  Y2 . . . . ,  Y13  una  m.a.  con  cada  Yj  ~  N(y2,o2),  que  indica  el  nivel  de  hierro  en  sangre  del  niño 
j  sano  (medido  en  ymol/l).  Las  v.a.  X.¡  e  Y:¡  son  independientes. 

En  este  caso  el  problema  se  plantea  como: 

H0  ■  yi  =  ¡J.2  vs.  Ha  :  y-2 


o  en  forma  equivalente 


H0:  y  1  -  ¿¿2  =  0  vs.  HA  :  yx  -  y2  ^  0 


La  regla  de  decisión,  para  este  test  bilateral,  será: 


A 


rechazar  Hq  :  yi 
el  valor  |t|  =  — 

Sp 


Si  deseamos  un  nivel  de  significación  a  =  0.05,  el  valor  crítico  será  io. 025,20  =  2.086.  Aquí, 
tenemos  los  valores  s 2  =  8x6,3  ^q2x5'9  =  36.762  y  el  valor  del  estadístico  de  prueba  es 

t  =  - n.9-18.9  _  2.6624.  Como  el  valor  del  estadístico  de  prueba  cae  en  la  zona  de  re- 

6.0632  a/i/9+1/13 

chazo,  se  puede  rechazar  la  hipótesis  nula  con  nivel  a  =  0.05.  Entonces  podemos  afirmar,  con 
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a  =  0.05,  que  el  nivel  medio  de  hierro  en  sangre  de  los  niños  con  fibrosis  quística  es  diferente  al 
de  los  niños  sanos. 

También  podemos  ver  que  el  valor  crítico  ío. 01,20  =  2.528  (para  el  test  bilateral  correspondien¬ 
te  a  a  =  0.02)  y  el  fo.005,20  =  2.8453  (que  corresponde  a  a  =  0.01),  esto  significa  que  podemos 
rechazar  Hq  con  nivel  a  =  0.02,  pero  no  con  nivel  a  =  0.01.  Se  suele  decir  que  el  resultado  es 
significativo  a  nivel  0.02,  o  que  el  valor-p  estaría  entre  0.01  y  0.02. 


EJERCICIO  7.2 

1  Demostrar  que  S2,  definido  en  G3J,  es  un  estimador  insesgado  para  a2  cuando  las  v.a. 
Xi,  A'2, . . . ,  XUl  tienen  distribución  7V(mi,  cr2)  y  las  v.a.  El,  Y2, . . . ,  Yn2  tienen  distribución 
ÍV(aí2,o'2)  con  varianzas  desconocidas  pero  iguales  y  son  independientes  entre  sí. 

2  A  dos  grupos  de  adultos  se  les  hicieron  pruebas  de  audiometría.  El  primer  grupo  estuvo  for¬ 


mado  por  11  adultos  que  trabajan  temporalmente  en  carpinterías.  La  calificación  media  para 
este  grupo  fue  de  26  decibelios  ( dB )  con  una  desviación  estándar  de  5  dB.  El  segundo  grupo, 
que  incluyó  a  14  personas  que  trabajan  temporalmente  en  peluquerías,  tuvo  una  calificación 


promedio  de  21  dB  con  una  desviación  estándar  de  6  dB.  Suponga  que  las  poblaciones  siguen 


una  distribución  normal  con  varianzas  iguales,  ¿hay  evidencia  suficiente  para  afirmar  que  los 
niveles  medios  de  la  audiometría  para  los  que  han  trabajado  temporalmente  en  las  carpintería 
es  mayor  a  3  dB  que  los  que  trabajan  temporalmente  en  peluquerías? 

En  muchas  aplicaciones,  la  suposición  de  que  las  varianzas  de  las  dos  poblaciones  son  iguales 
es  poco  realista. 

Intervalo  de  confianza  y  test  para  la  diferencia  de  medias  de 
dos  poblaciones  normales  con  varianzas  desconocidas 

Sean  dos  m.a.  X1;  X2,  ■  .  . ,  Xni  con  distribución  iV(Mi,cr2)  e  Y1:Y2, . . .  ,Yn2  con  distribución 
JV(/t2,  o-!)  independientes  entre  sí  y  con  varianzas  desconocidas.  Luego  la  función 


X-Y-  (mi  -  M2) 


tiene  distribución  1V(0, 1),  pero  como  desconocemos  las  varianzas,  la  función  pivote  será: 

Z-F-(m  1-M2) 
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la  distribución  de  esta  función  pivote  se  aproxima  a  una  Student  con  v  grados  de  libertad,  donde: 


[{sl/ni)  +  0¡/n2)]2 

(#1  )2  ,  («l/"2)2 

ni  — 1  '  n  2  —  1 


Aclaración 

Para  los  grados  de  libertad,  se  toma  al  entero  más  próximo  al  valor  calculado  en  (O- 


Entonces  el  intervalo  de  confianza  de  nivel  1  —  a  para  /ii  —  ¿¿2  resulta: 


/  C¡2  Cj2  _  _  /  c¡2  Cj2 

—  H2)  =  I  X  —  Y  —  ta/2  V  x  \  —  H - -  ,X  —  Y  +  ta/ 2„  x  y  —  H - - 

1  1/  ni  n2  '  \  ni  ri2 


Ejemplo  7.5 


Se  tienen  datos  de  la  actividad  total  del  complemento  serológico  en  10  sujetos  enfermos: 
27.1  90.9  67.7  98.7  58.5  76.9  91.1  95.5  56.5  92.6 


y  en  20  sujetos  aparentemente  normales: 


44.6 

58.1 

44.1 

55.9 

30.1 

53.8 

56.8  43.9  61.4 

58.3 

30.3 

44.1 

48.7 

45.5 

42.2 

49.5 

57.9  44.5  34.5 

41.5 

Asumimos  que  estas 

son  observaciones  de 

las  v.a. 

xux2 

,  .  .  .  ,  Á'10  e  Yi,  Y2;  •  • 

. ,  Y20,  donde  es  la 

medición  del  complemento  serológico  del  sujeto  i  del  grupo  de  enfermos  con  ~  N(ni,af),  e  Yj 
es  la  medición  del  complemento  serológico  del  sujeto  j  del  grupo  de  sanos  con  Yj  ~ 

Si  deseamos  construir  un  intervalo  de  confianza  para  la  diferencias  de  medias,  de  nivel  0.98, 
tenemos  que:  x  =  75.55,  y  =  47.285,  Si  =  23.0133,  s2  =  9.2361,  v  =  10.4758  (entonces  se  tomará 
10  grados  de  libertad)  y  ío.01,10  =  2.7638,  entonces  obtenemos: 


/ 23  01332  9  23612 

/C'o.qs^i  -  ¿¿2)  =  75.55  -  47.285  ±  2.7638  x  J  — - —  +  '  ^  =  (7.3574, 49.1726) 


Para  realizar  un  test  el  estadístico  de  prueba  es: 


T  = 


X -Y- A 


\/ 


sf.sl 

ni  '  ri2 


0 


cuando  Hq  :  yui — ¡12  =  Ao  es  verdadera,  la  distribución  de  este  estadístico  se  aproxima  a  una  Student 
con  v  grados  de  libertad  definidos  en  (E2D-  Entonces  resumiendo  los  posibles  tests  tenemos: 
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RESUMEN  7.3 


Para  las  m.a.  X\,X2, ,  Xni  con  distribución  N(y  i,  af)  e  Yj,  Y2, . . . ,  Yn2  con 
distribución  N(y2,c r|),  independientes  entre  sí. 

Hipótesis  nula 

Hq  ■  Mi  —  M2  —  Ao 

Valor  del  estadístico 

de  prueba 

x-y-  A0 

\!  —  +  — 
y  ni  ri2 

Hipótesis  alternativa 

Ha  '■  yi  —  y-2  <  A0 

Ha  :  ¿ti  —  >  A0 

Ha  :  ¿t i  —  ¿t2  7^  A0 

Región  de  rechazo  con 

nivel  a 

t  <C  ^Oí,V 

1^1  ^a/ 2,1/ 

Ejemplo  7.6 


Se  propone  un  tratamiento  para  la  artritis  reumatoide,  que  es  aplicado  a  una  muestra  de  6 
pacientes,  a  los  que  se  mide  la  concentración  de  tiol  en  sangre.  Estos  valores  se  comparan  con 
los  de  5  pacientes  control  tratados  con  placebo. 

control  2.81  3.62  3.27  2.35  3.67 

tratamiento  1.95  2.10  2.05  1.92  2.56  2.30 

Sabiendo  que  la  concentración  de  tiol  en  sangre  se  distribuye  normalmente,  ¿hay  suficiente 
evidencia  para  afirmar  que  el  tratamiento  reduce  los  valores  de  tiol?  (a  =  0.05). 

Definimos  al  valor  de  concentración  de  tiol  en  sangre  del  paciente  i  del  grupo  control, 
Xi  ~  N(n i,  af),  con  i  =  1, . . . ,  5  y  definimos  Yj  al  valor  de  concentración  de  tiol  en  sangre  del 
paciente  j  del  grupo  en  tratamiento,  Yj  ~  _/V(¿¿2,  <J2),  j  —  1, . . . ,  6.  Ambas  varianzas  desconocidas. 
Para  estas  dos  m.a.  los  valores  calculados  resultan  ser:  x  =  3.144,  y  =  2.1467,  si  =  0.5615  y 
s2  =  0.2433. 

Este  caso  de  test  se  puede  plantear  como: 

lío  :  í¿i  =  l¿  2  vs.  HA:  ¡ii>  /x2 


o  en  forma  equivalente: 


ií0  :  ¿¿i  -  ¿¿2  =  0  vs.  Ha  :  ni  —  ¡jl2>  0 


el  estadístico  de  prueba  es: 


T  = 


X  -  Y  -  0 


si  ,  si 

5^6 


cuando  Hq  :  ¿ti  —  =  0  es  verdadera,  la  distribución  de  este  estadístico  se  aproxima  a  una 

Student  con  5  grados  de  libertad  (  por  (17.21)  v  =  5.2468).  Luego,  la  regla  de  decisión  será: 
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rechazar  HQ  :  /¿i  —  ¿¿2  =  O  a  favor  de  Ha  ■  Mi  —  ¿¿2  >  0  cuando  t  >  1 0.05,5 


El  valor  del  estadístico  de  prueba  es  t  =  3.6931  y  ¿o. 05, 7  =  2.015,  entonces  se  puede  rechazar  la 
hipótesis  nula  a  nivel  0.05.  Es  decir,  se  puede  afirmar,  con  nivel  a  =  0.05,  que  el  tratamiento 
reduce  los  valores  de  tiol. 


EJERCICIO  7.3 

Los  siguientes  datos  proporcionan  información  resumida  sobre  permeabilidad  al  aire,  medido  en 
cm3 / cm? / seg ,  de  dos  tipos  de  tela:  algodón  y  triacetato. 


Tipo  de  tela 

Tamaño  muestral 

media  muestral 

desviación  estándar  muestral 

algodón 

10 

51.71 

0.79 

triacetato 

10 

136.14 

3.59 

Suponemos  que  la  permeabilidad  de  ambos  tipos  de  telas  son  normales. 

Calcular  el  intervalo  de  confianza  de  nivel  95  %  para  la  diferencia  de  permeabilidad  media  de 
ambos  tipos  de  telas. 

2.  ¿Se  puede  afirmar  que  la  permeabilidad  media  del  triacetato  supera  a  la  permeabilidad  media 
del  algodón  en  más  de  80  cm3  / cm? / segl 


Análisis  de  datos  apareados 


La  característica  fundamental  de  las  muestras  apareadas,  es  que  a  cada  observación  en  el  primer 
grupo,  le  corresponde  una  en  el  segundo  grupo.  Generalmente  se  trata  de  dos  mediciones  realizadas 
a  un  mismo  individuo  en  dos  ocasiones,  un  ejemplo  común  es  el  experimento  “antes  y  después”, 
donde  a  cada  individuo  se  le  realiza  un  examen  antes  de  aplicar  un  tratamiento  y  se  vuelve  a  realizar 
ese  examen  después  del  tratamiento.  En  otras  ocasiones  el  investigador  relaciona  cada  individuo 
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de  un  grupo,  con  otro  individuo  que  tenga  muchas  características  en  común;  en  algunos  casos 
pueden  ser  hermanos  gemelos,  o  simplemente  individuos  de  la  misma  edad,  sexo,  con  condiciones 
ambientales  semejantes,  etc.  También  se  usa  este  diseño  cuando  se  comparan  dos  métodos  de 
medición. 

Se  utiliza  el  apareamiento  para  controlar  fuentes  de  variación  ajenas  al  experimento,  que  podrían 
influir  en  los  resultados  del  mismo. 

En  este  caso  los  datos  no  se  presentan  como  dos  muestras  independientes,  sino  como  una 
muestra  de  pares  de  v.a.: 


(X1,Y1),(X2,Y2),...,(Xn,Yn), 


Se  calculan  las  diferencias: 


D1=X1-  Yy.Jh  =  X2-Y2,...,Dn  =  Xn  -  Yn, 


y  vamos  a  suponer  que  estas  diferencias  tienen  distribución  normal,  es  decir,  Di  ~  N(hd,  cr2D), 
donde  ¡¿d  =  Mi  ~~  Ú2- 

Entonces,  para  construir  un  intervalo  de  confianza  para  /.¿d  se  utiliza  la  función  pivote: 

D  —  un 


T  = 


Sd/Vü 


_  ^  ^ 

que  tiene  distribución  Student  con  n  —  1  grados  de  libertad,  donde  D  =  —  y  Di  y 

n 

¿= i 


SD  = 
sulta: 


\ 


1  n  _ 

— —  yy^(Dj  —  D)2 .  El  intervalo  de  confianza  de  nivel  1  —  a  para  /i£>  =  —  fi2  re- 


n  —  1 


_ 

D  toi/2,n—l  ^  / —  j  D  +  ta/2,n—  1  ^  1= 

v  n 


Ejemplo  7.7 


Se  quiere  comparar  dos  métodos  de  laboratorio.  La  concentración  de  plomo  (/i g/l )  de  cada  una 
de  cinco  muestras  es  determinada  por  dos  métodos  diferentes,  con  los  resultados  que  se  muestran 
en  la  siguiente  tabla: 


muestra 

1 

2 

3 

4 

5 

oxidación  húmeda 

71 

61 

50 

60 

52 

extracción  directa 

76 

68 

48 

57 

61 

Suponiendo  normalidad  para  la  diferencia  entre  los  métodos  de  oxidación  húmeda  y  de  extracción 
directa,  calculemos  el  intervalo  de  confianza  de  nivel  0.995. 

Sea  la  m.a.  D±,  D2, .  ■  ■ ,  D$  con  cada  que  indica  la  diferencia  de  concentración  de  plomo 
(fj-g/l)  entre  los  métodos  (“oxidación  húmeda-extracción  directa”)  de  la  muestra  i,  cuya  distri¬ 
bución  es  Los  valores  muéstrales  de  las  v.a.  son:  -5,  -7,  2,  3  y  -9,  de  los  que 

resulta  d  =  —3.2,  Sd  =  5.4037  y  además  tenemos  por  la  Tabla  que  ío.0025,4  =  5.59  76.  Entonces 
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el  intervalo  de  confianza  de  nivel  0.995  será: 


/C'o.ggs^i  -  Aí2)  =  -3.2  -  5.5976  x 


5.4037 


,  —3.2  +  5.5976  x 


5.4037 

vr 


=  (-16.2586,9.8586) 


Para  realizar  un  test  el  estadístico  de  prueba  para  la  hipótesis  Hq  '■  =  Ao  es: 

D-A0 

SD/Vñ 

que,  si  Hq  es  verdadera,  tiene  distribución  Student  con  n  —  1  grados  de  libertad.  Resumimos  a 
continuación  los  casos  de  tests  para  muestras  apareadas: 


RESUMEN  7.4 


Para  la  muestra  apareda  (Xi ,  Yj),  (X2,  U)>  •  •  •  >  (Xn,  Y„)  con  distribución  normal 

conjunta,  definiendo  obtenemos  Di  ~  N(^id,o'd)- 

Hipótesis  nula 

Hq  :  g,D  =  Ao 

Valor  del  estadístico 

de  prueba 

í  -  ^  ~  A° 

SD¡\fñ 

Hipótesis  alternativa 

Ha  :  ¡id  <  Ao 

Ha  :  /í£>  >  A0 

Ha  '■  Hd  ^  A0 

Región  de  rechazo  con 

nivel  a 

^  ^  ta,n—l 

^  ^  ta,n— 1 

1^1  -'>  ^ Oi/2,n—l 

Ejemplo  7.8 


Se  dan  los  niveles  de  colesterol  ( mg/dl )  en  suero  para  12  sujetos,  antes  y  después  de  un  programa 
combinado  de  dieta  y  ejercicio.  Se  desea  medir  la  efectividad  del  tratamiento  para  reducir  el 
colesterol,  expresada  por  la  diferencia  de  valores  medios  entre  “antes”  y  “después” .  Se  considera 
que  el  tratamiento  es  efectivo  si  reduce  los  valores  medios  de  colesterol  en  más  de  50  mg/dl. 
Considerar  normalidad  para  las  diferencias. 


Sujeto 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

antes 

281 

285 

305 

298 

356 

287 

273 

287 

289 

317 

324 

281 

después 

210 

216 

239 

238 

289 

232 

227 

223 

240 

237 

256 

206 

Diferencia 

71 

69 

66 

60 

67 

55 

46 

64 

49 

80 

68 

75 

Sea  la  m.a.  Di,  D2,  ■ .  ■ ,  DV2  con  cada  que  indica  la  diferencia  de  los  niveles  de  colesterol 
(mg/dl)  en  suero  antes  y  después  del  tratamiento  en  el  sujeto  i  (las  diferencias  son 
“antes-después” )  cuya  distribución  es  .ZV  (//£>,  cr|>).  De  los  valores  observados  para  estas  dife¬ 
rencias,  ya  calculadas  en  la  tabla  de  arriba,  se  obtienen  d  =  64.1667  y  =  10.116.  Luego,  el 
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problema  queda  planteado  como:  Hq  :  /xp  =  50  vs.  Ha  :  [íd  >  50,  el  estadístico  de  prueba  será: 


Sü/Vñ 

que  bajo  Hq  tiene  distribución  de  Student  con  n  —  1  grados  de  libertad  y  la  regla  de  decisión 
será:  rechazar  Hq  :  /i£>  =  50  a  favor  de  Ha  ■  Hd  >  50  cuando  t  >  ta, n- 

El  valor  del  estadístico  de  prueba  es  t  =  4.8512,  vemos  que  el  valor  del  estadístico  de  prueba  es 
mayor  que  todos  los  valores  críticos  que  tenemos  tabulados  para  11  grados  de  libertad  en  nuestra 
Tabla,  luego  el  valor-p  <  0.0005.  Esto  significa  que  hay  fuerte  evidencia  de  que  el  tratamiento  es 
efectivo  y  reduce  los  valores  medios  de  colesterol  en  más  de  50  md/dl. 


EJERCICIO  7.4 

La  adición  de  imágenes  médicas  computarizadas  a  una  base  de  datos  promete  proporcionar  grandes 
recursos  para  médicos.  Sin  embargo,  existen  otros  métodos  de  obtener  tal  información,  de  modo 
que  el  tema  de  eficiencia  de  acceso  tiene  que  ser  investigado.  Un  artículo  de  revista  reportó  sobre 
un  experimento,  en  el  cual  a  10  profesionales  médicos  expertos  en  la  computadora  se  les  tomó  el 
tiempo  mientras  recuperaban  una  imagen  de  una  biblioteca  de  diapositivas  y  mientras  recuperaban 
la  misma  imagen  de  una  base  de  datos  de  una  computadora  con  conexión  a  la  Web. 


Sujeto 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

Diapositiva 

32 

35 

40 

25 

20 

30 

35 

52 

40 

41 

Digital 

20 

16 

15 

15 

10 

20 

7 

16 

15 

13 

Diferencia 

12 

19 

25 

10 

10 

10 

28 

36 

25 

28 

Calcule  el  intervalo  de  confianza  del  96  %  para  la  diferencia  de  medias.  Haga  los  supuestos  necesa¬ 
rios. 


Intervalo  de  confianza  y  test  para  la  diferencia  de  medias  con 
muestras  grandes 


Cuando  tenemos  dos  muestras  independientes,  pero  desconocemos  la  distribución  de  los  datos, 
si  las  muestras  son  “grandes”  se  puede  usar  la  aproximación  del  Teorema  Central  del  Límite  (TCL) 
como  en  el  caso  de  una  muestra. 

Si  tenemos  dos  muestras  independientes  Xi,  X%. . . . ,  Xni  e  Yi,  Y%, . . . ,  Yn2  con  distribuciones 
desconocidas  y  tamaños  muéstrales,  ni  y  n2,  grandes,  con  E(Xi)  =  /ii  y  E(Yj)  =  /x2  y  queremos 
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construir  un  intervalo  de  confianza  para  /ii  —  /X2,  la  función  pivote  que  podemos  utilizar  es: 


Z  = 


X  —  Y  —  (/l¿i  —  p.2) 


£i  .  S 

ni  n2 


Cuando  ni  y  n2  son  “grandes”,  V  tiene  una  distribución  aproximadamente  V(0,1).  Entonces  el 
intervalo  de  confianza  para  —  ¿¿2,  de  nivel  aproximado  1  —  a,  será: 


ICa{n  1  —  1^2) 


f  v  -  y  -  za/2  x 


'2  +  S,v-y. 

ni  n2 


Za/2 


Ejemplo  7.9 


Motivados  por  el  conocimiento  de  la  existencia  de  una  gran  cantidad  de  textos  polémicos  que 
sugieren  que  el  estrés,  la  ansiedad  y  la  depresión  son  dañinos  para  el  sistema  inmunológico,  se 
condujo  a  un  estudio  en  el  que  se  consideró  un  grupo  de  pacientes  con  HIV  positivo  y  otros 
con  HIV  negativo.  Los  datos  fueron  registrados  con  una  amplia  variedad  de  mediciones  médicas, 
inmunológicas,  psiquiátricas  y  neurológicas,  una  de  las  cuales  corresponde  al  número  de  células 
CD4+  en  la  sangre.  El  número  promedio  de  células  CD4+  para  112  individuos  con  infección  por 
HIV  fue  de  401.8  con  una  desviación  estándar  de  226.4  y  para  los  75  individuos  sin  infección  por 
HIV,  la  media  y  la  desviación  estándar  fueron  de  828.2  y  274.9,  respectivamente.  Se  pretende 
elaborar  un  intervalo  de  confianza  de  99  %  para  las  diferencias  de  las  medias  de  las  poblaciones. 

Modelizando  tenemos  una  m.a.  Vi,  V2, . . . ,  V112  con  cada  V¿  que  indica  el  número  de  células 
CD4+  en  la  sangre  en  el  paciente  i  con  HIV  positivo  siendo  E(V¿)  =  fi  1  y  otra  m.a  Vi,  V2, . . . ,  V75 
donde  Y¡  indica  el  número  de  células  CD4+  en  la  sangre  en  el  paciente  j  con  HIV  negativo  siendo 
E(Yj)  =  [i2 ■  Las  v.a.  V¿  e  Yj  son  independientes.  No  hay  información  respecto  a  la  distribución 
del  número  de  células  CD4+  en  la  sangre  (se  desconoce  la  distribución  de  las  v.a.  V¿  e  Yj).  Sin 
embargo,  como  el  tamaño  de  las  muestras  es  grande,  el  Teorema  Central  del  Límite  asegura  que 
la  distribución  muestral  de  las  diferencias  entre  las  medias  muéstrales  siguen  una  distribución 
aproximadamente  normal. 

Entonces  tenemos  x  =  401.8,  y  =  828.2,  si  =  226.4,  S2  =  274.9  y  £0.005  =  2.5758.  Por  lo 
tanto,  el  intervalo  de  confianza  de  nivel  aproximado  del  99  %  para  la  diferencia  de  las  medias  es: 

/ 226  42  274  92 

JCo.gg^i  -  y 2)  =  401.8  -  828.2  ±  2.5758  x  J  ^  +  — —  =  (-524.998,  -327.802) 

Se  tiene  la  seguridad  de  99  %  de  que  el  promedio  de  células  CD4+  en  pacientes  con  HIV  negativo 
supera  a  la  media  de  los  pacientes  con  HIV  positivo  en  un  valor  entre  327.802  y  524.998. 


Si  se  quiere  realizar  un  test  para  comparar  las  medias,  donde  la  hipótesis  nula  es 
Hq  :  /ri  —  y,2  =  Ao,  el  estadístico  de  prueba  que  podemos  usar  es: 

Z=V-V-A0 


sí 

ni 


si 

n  2 
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que,  cuando  Hq  es  verdadera  y  ni  y  n2  son  “grandes” ,  tiene  una  distribución  aproximadamente 
N( 0, 1).  A  continuación,  resumimos  los  tests: 


RESUMEN  7.5 


Para  las  m.a.  independientes  X\ ,  V2 , . . .  ,X 

ni  e  Yi,  Y2, . . . ,  Y„2  con  distribuciones 

desconocidas  donde  n\  y  n2  son  “grandes” . 

Hipótesis  nula 

Hq  ■  Mi  —  —  Aq 

Valor  del  estadístico 

x  —  y  —  A0 
z  =  — . 

de  prueba 

.  ñ.  _|_  ii 

V  ni  ri2 

Hipótesis  alternativa 

Ha  :  g i  —  g.2  <  Xq 

Ha  :  /r i  —  A¿2  >  Ao 

Ha  :  /líi  —  ¿t2  ^  A0 

Región  de  rechazo  con 

z  <  —za 

z  >  za 

M  >  -a/2 

nivel  aproximado  a 

Ejemplo  7.10 


En  un  estudio  de  factores  que  se  consideran  responsables  de  los  efectos  adversos  del  tabaquismo 
sobre  la  reproducción  humana,  se  midieron  los  niveles  de  cadmio  (nanogramos  por  gramo)  en 
el  tejido  de  la  placenta.  En  una  muestra  de  140  madres  que  fumaban  se  obtuvo  una  media  de 
16.72  ng  y  un  desvío  de  6.19  ng.  En  otra  muestra  aleatoria  independiente  de  180  mujeres  no 
fumadoras  se  obtuvo  una  media  de  18.41  ng  y  un  desvío  de  6.81  ng.  ¿Hay  suficiente  evidencia 
para  afirmar  que  el  tabaco  reduce  el  nivel  de  cadmio  en  el  tejido  de  la  placenta? 

Modelizamos:  una  m.a.  Xj ,  V2, . . . ,  X-¡4q  con  cada  X,  que  indica  el  nivel  de  cadmio 
(nanogramos  por  gramo)  en  el  tejido  de  la  placenta  en  la  madre  i  fumadora  siendo  E(X i)  = 
y  otra  m.a  Y),  U , . . . ,  Uso  que  indica  el  nivel  de  cadmio  (nanogramos  por  gramo)  en  el  tejido  de 
la  placenta  en  la  madre  j  no  fumadora  siendo  E(Yj)  =  /¿2.  Las  v.a.  e  Y)  son  independientes 
entre  sí  y  no  hay  información  con  respecto  a  la  distribución  del  nivel  de  cadmio  (nanogramos 
por  gramo)  en  el  tejido  de  la  placenta,  es  decir  que  se  desconoce  la  distribución  de  las  v.a.  X{ 
e  Yj.  Sin  embargo,  como  el  tamaño  de  las  muestras  es  grande,  el  Teorema  Central  del  Límite 
asegura  que  la  distribución  muestral  de  las  diferencias  entre  las  medias  muéstrales  siguen  una 
distribución  aproximadamente  normal. 

El  planteo  del  test  que  deseamos  es: 

H0  :  ni  =  a¿2  vs.  Ha:  ¡x 2  >  /i-, 

o  en  forma  equivalente: 


Tío  :  Mi  —  ^2  =  0  vs.  Ha  :  ¿ü  -  ¿t2  <  0 


Para  este  problema  el  estadístico  de  prueba  será: 

Z  =  X-7-0 


V  ni 


n2 
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Cuando  Hq  :  p,i  —  /l¿2  =  0  es  verdadera,  la  distribución  de  este  estadístico  de  prueba  se  aproxima 


a  una  normal  (por  TCL)  y  la  regla  de  decisión  será  rechazar  Hq  si  el  valor  z 


El  valor  del  estadístico  de  prueba  es: 


x-y 


za . 


2  = 


16.72  -  18.41 


6.192  _|_  6.812 
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180 


-2.32 


Calculemos  el  valor-p  para  poder  responder: 


esto  significa  que,  hasta  con  un  nivel  0.0102,  podemos  afirmar  que  el  tabaco  reduce  el  nivel  de 
cadmio  en  el  tejido  de  la  placenta. 


Ahora,  en  cambio,  si  tenemos  muestras  apareadas  grandes  y  no  conocemos  la  distribución, 
también  se  calculan  las  diferencias  y  se  trabaja  como  en  el  caso  de  una  muestra  grande  aplicando 
el  TCL.  Es  decir,  la  función  pivote  será 

_  D  -  /j,p 

~  sD/v^ 

que,  cuando  n  es  grande,  tiene  distribución  aproximada  ÍV(0, 1),  entonces  el  intervalo  de  confianza 
para  hd  =  de  nivel  aproximado  1  —  a  será: 

IC\-a(nD)  =  (  D  —  Za/ 2  X  D  +  Za/2  X 

\  y  TI  \Jn 


Ejemplo  7.11 


Las  personas  que  padecen  el  síndrome  de  Reynaud  están  propensas  a  sufrir  un  deterioro  repentino 
de  la  circulación  sanguínea  en  los  dedos  de  las  manos  y  de  los  pies.  En  un  experimento  para 
estudiar  el  grado  de  este  deterioro,  cada  uno  de  los  58  sujetos  sumergió  un  dedo  índice  en  agua  y 
se  midió  la  producción  de  calor  resultante  (cal / cmr  / min) .  La  diferencia  de  producción  de  calor 
promedio  antes  y  después  de  haber  puesto  el  dedo  en  el  agua  fue  0.64  y  un  desvío  estándar  de 
0.2.  Construya  el  intervalo  de  confianza  del  98%  para  la  diferencia  promedio  de  calor  resultante 
antes  y  después  de  sumergir  el  dedo  en  el  agua. 

Sean  Uj  las  diferencias  de  producción  de  calor  antes  y  después  de  haber  puesto  manos  y  pies 
en  el  agua,  i  =  1, ...  ,58  siendo  E(Di)  =  /i£>.  La  distribución  de  las  Z>¿  es  desconocida  pero  la 
muestra  es  grande  y  podemos  usar  TCL. 
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La  función  pivote  es: 


_  D  —  fip 

Sp/y/ñ 

que  tiene  distribución  aproximada  N{ 0, 1).  Tenemos  d  =  0.64,  s¿  =  0.2  y  zq.oi  =  2.3263  entonces 
el  intervalo  es: 


ICo.9S(iJ,D)  =  (  0.64-  2.3263  x  ££,0.64  +  2.3263  x 

V58 


0.2 

y/58 


=  (0.5789,0.7011) 


Para  realizar  un  test,  el  estadístico  de  prueba  es 

S-Ao 

Sp/y/ñ 

que,  si  Hq  \ip  =  Ao  es  verdadera  y  n  es  grande,  tiene  distribución  aproximada  1V(0, 1).  Resumimos 
a  continuación  los  distintos  casos  de  tests: 

RESUMEN  7.6 


Para  la  muestra  apareada  (Xx,  Yj),  (X2,  Y2), . . . ,  (Xn.  Yn),  con  distribución 

desconocida  y  n 

grande,  definiendo  Di  =  —  Y¡,  donde  E(Di )  =  ¡j,p. 

Hipótesis  nula 

Hq  :  fip  =  Aq 

Valor  del  estadístico 

d  —  A0 

de  prueba 

Sp/y/ñ 

Hipótesis  alternativa 

Ha  :  ¿¿d  <  A0 

Ha  :  >  A0 

Ha  :  ¿Cd  7^  Ao 

Región  de  rechazo  con 

2  <  —  Za 

z  >  za 

M  >  Za/2 

nivel  aproximado  a 

Ejemplo  7.12 


Se  requiere  información  sobre  la  postura  de  la  mano  y  las  fuerzas  generadas  por  los  dedos 
durante  la  manipulación  de  varios  objetos  cotidianos  para  diseñar  prótesis  de  alta  tecnología 
para  la  mano.  Cierto  artículo  reportó  que  para  una  muestra  de  110  mujeres  la  diferencia  entre 
la  fuerza  de  opresión  con  cuatro  dedos  ( N )  entre  la  mano  derecha  e  izquierda  fue  de  98.1  N  y 
la  desviación  estándar  de  143.2  N.  ¿Existe  evidencia  suficiente  para  concluir  que  hay  diferencia 
entre  la  fuerza  promedio  verdadera  en  cada  mano? 

Sean  D.¡  las  diferencias  entre  la  fuerza  de  opresión  con  cuatro  dedos  (N)  entre  la  mano  derecha 
e  izquierda,  i  =  1, . . . ,  110,  siendo  E{Di)  =  ¡ip.  La  distribución  de  las  es  desconocida  pero  la 
muestra  es  grande  y  podemos  usar  TCL.  Las  hipótesis  son: 

H0  :  np  =  0  vs.  HA:  ¡jld  ^  0 
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Para  este  problema  el  estadístico  de  prueba  será: 


sD/vm 

con  distribución  aproximada  N{ 0, 1),  si  Hq  es  verdadera. 

Reemplazando  con  los  datos,  el  valor  del  estadístico  de  prueba  es  2  =  143  ^/l/no  =  ^-1849. 
Luego  valor-p  =  P(\Z\  >  7.18)  =  2x  (1-  $(7.18))  =  0.  Es  decir,  hay  mucha  evidencia  contra 
Hq,  con  lo  cual  se  puede  afirmar  que  hay  diferencia  entre  la  fuerza  promedio  verdadera  en  cada 
mano. 


EJERCICIO  7.5 

Un  programa  de  pérdida  de  peso  afirma  que  después  de  tres  meses  de  tratamiento  los  pacientes 
pierden  en  media  4  kg.  Se  estudió  una  muestra  de  60  participante  de  ese  programa  y  se  observó  que 
la  media  de  las  diferencias  de  pesos  fue  de  4.6  kg  y  su  desvió  fue  de  1.2  kg.  ¿Estos  datos  confirman 
dicha  afirmación? 


Inferencias  en  relación  con  la  diferencia  entre  proporciones 
(muestras  grandes) 


Ya  vimos  al  tratar  el  tema  intervalo  de  confianza  y  test  para  una  proporción  que,  si  tenemos 
una  v.a.  A'  con  distribución  B(n,p )  y  n  es  suficientemente  grande,  la  distribución  de: 


Z  =  p~p 

Vp(l-p)/n 

es  aproximadamente  N( 0, 1)  por  TCL.  Ahora,  si  tenemos  dos  v.a.  X  e  Y  independientes  y  con  distri¬ 
buciones  B(ni,pi)  y  B(ri2,P2)  respectivamente,  donde  n\  y  ri2  son  grandes,  definimos 
pi  =  X/ni  y  P2  =  Y/ri2,  el  estimador  obvio  para  p\  —  P2  es  p\  —  p2,  y  se  puede  ver  que: 

-s  Tr  -N  í’i(l-pi)  p2{l~P2) 

E(pi  ~P2)  =P1  -P2  y  V ar{pi  —  P2)  = - 1 - 

n  1  ri2 


entonces: 


Z  = 


P1-P2-  (pi  ~  P2) 


pi(i-pi) 

ni 


P2  (1  P2) 

n  2 


tiene  distribución  aproximadamente  ÍV(0, 1).  Si  se  desea  construir  un  intervalo  de  confianza  para 
Pi  ~P2,  no  podemos  usar  Z  como  función  pivote,  pero  podemos  modificarla  y  usar: 


Z  = 


Pl~P2-  (pi  ~  P2) 

/Pl(l-Pl)  i  P2  (1-P2) 
y  ni  '  ri2 
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que  también  tiene  distribución  aproximadamente  N( 0, 1). 

Entonces  el  intervalo  de  confianza  de  nivel  aproximado  1  —  a  resulta: 


ICi-a(pi 


P2)  =  Pl  -  P2  ±  Za/2  x 


Fl(l  -Pl)  ,  P2  (1-P2) 


n  1 


n2 


Ejemplo  7.13 


Se  encuestaron  67  médicos  y  133  enfermeras  con  familiares  fármaco-dependientes.  El  propósito 
del  estudio  era  evaluar  la  influencia  en  los  médicos  y  enfermeras  de  estar  estrechamente  involucra¬ 
dos  con  una  o  más  personas  fármaco-dependientes.  Se  obtuvo  que  52  médicos  y  89  enfermeras  di¬ 
jeron  que  vivir  con  personas  fármaco-dependientes  afectaban  adversamente  su  trabajo.  Deseamos 
construir  un  intervalo  de  confianza  de  98  %  para  la  diferencia  entre  las  proporciones  de  médicos 
y  enfermeras  que  estén  adversamente  afectados  por  vivir  con  personas  fármaco-dependientes. 

Modelizamos  el  problema:  sean  la  v.a.  X  el  número  de  médicos,  entre  los  67  que  se  encuesta- 
ron,  que  son  afectados  en  su  trabajo,  X  ~  13(67, pi)  y  la  v.a.  Y  el  número  de  enfermeras,  entre 
las  133  que  se  encuestaron,  que  son  afectadas  en  su  trabajo,  Y  ~  13(133, p2).  Entonces  tenemos: 
x  =  52,  y  =  89,  resultando  p\  =  52/67  y  p2  =  89/133.  Y  además  zo.01  =  2.3263.  Entonces  el 
intervalo  de  confianza  de  nivel  aproximado  0.98  resulta: 


IC0.98{pi  -p2)  =  p  -  ^  ±  2.3263  x 


52/67  (1  -  52/67)  89/133  (1  -  89/133) 


67 


133 


=  (-0.0449,0.2587) 


Ahora,  si  se  desea  hacer  un  test  de  hipótesis  donde  Hq  :  p\  =  p2l  para  definir  la  función  pivote 
tendremos  en  cuenta  que,  bajo  Ho>  las  dos  proporciones  son  iguales  y  podemos  llamar  p  a  ese  valor 
(es  decir,  p  =  p\  =  p2).  Entonces: 

E(j>i  -P2)  =Pi  ~P2  =  0  y  Var(p!  -p2)  =  — —  =  p  (1  -  p)  f—  +  —  ^ 

ni  n2  \n  1  n2 ) 

Luego,  si  H0  es  verdadera,  el  estadístico: 

z  =  Pl  ~P2 _ 

tiene  distribución  aproximadamente  N( 0, 1)  y  puede  usarse  como  estadístico  de  prueba.  Pero  co¬ 
mo  no  conocemos  el  valor  p  lo  reemplazamos  por  p  =  (Xi  +  X2)/(n\  +  n2 ),  que  también  tiene 
distribución  aproximadamente  1V(0, 1).  Resumimos  a  continuación  los  distintos  casos  de  tests: 
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RESUMEN  7.7 


Para  las  v.a.  X  e  Y  independientes,  donde  X  ~  B(ni,pi)  e  Y  ~  £?(n2,P2), 

con  n  1  y  n2  grandes. 

Hipótesis  nula 

$ 

II 

10 

Valor  del  estadístico 

de  prueba 

z  =  — 

V 

P1—P2 

/p(l-p)(Jr+^) 

Hipótesis  alternativa 

Ha  :  Pi  <  P2 

HA  ■  Pl  >  P2 

Ha-Pi^  P2 

Región  de  rechazo  con 

nivel  aproximado  a 

z  <  —za 

z  >  za 

\z\  >  2a/2 

Ejemplo  7.14 


Se  realizó  un  estudio  con  2720  pacientes  que  habían  sufrido  un  infarto  cardíaco.  El  estudio 
asignó  aleatoriamente  cada  individuo  a  un  grupo  de  tratamiento,  que  recibieron  una  dosis  diaria 
de  aspirina  y  un  grupo  control,  tratado  con  un  placebo.  Se  realizó  un  seguimiento  durante  3 
años.  La  tabla  muestra  los  resultados  obtenidos: 


Grupo 

Número  de  muertos 

Tamaño  de  la  muestra 

Placebo 

56 

1368 

Aspirina 

36 

1352 

El  objetivo  de  este  estudio  era  determinar  si  la  toma  diaria  de  aspirina  en  pacientes  que  ya 
habían  sufrido  un  ataque  cardíaco,  modifica  la  tasa  de  mortalidad  para  futuros  infartos. 

Podemos  definir  X  como  el  número  de  muertes  por  infarto  durante  el  período  del  estudio  en 
pacientes  que  recibieron  placebo,  X  ~  23(1368,  pi)  e  Y  como  el  número  de  muertes  por  infarto 
durante  el  período  del  estudio  en  pacientes  que  recibieron  aspirina,  Y  ~  23(1352,  p2).  Se  quiere 
testear:  Hq  :  pi  =  p2  vs .HA  ■  Pi  ^  P2-  Si  Hq  es  verdadera,  el  estadístico: 

z  =  - 

\Jv  (1  ~  p)  (l368  +  1352  ) 

tiene  distribución  aproximadamente  2V(0, 1).  Aquí,  pi  =  0.0409,  p2  =  0.0266  y  p  =  0.0338.  El 
valor  del  estadístico  de  prueba  es  2  =  2.06  y  el  valor-p  para  esta  prueba  bilateral  es: 


valor-p  =  P(\Z\  >  2.06)  =  P(Z  >  2.06)  +  P(Z  <  -2.06)  =  0.0394 


Esto  significa  que  hay  evidencia  para  afirmar  que  hay  diferencias  entre  las  tasas  de  mortalidad. 
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EJERCICIO  7.6 

Como  parte  de  un  estudio  para  identificar  factores  de  riesgo  coronario  entre  hombres  y  mujeres  en 
una  clínica,  se  estudió  la  proporción  de  diabéticos  en  hombres  y  mujeres.  De  las  215  mujeres  58 
tenían  diabetes  al  igual  que  21  de  los  114  hombres. 

Elabore  un  intervalo  de  confianza  del  99  %  para  la  diferencia  de  proporciones  de  diabetes  en 
hombres  y  mujeres. 

2.  Se  pretende  saber  si  es  posible  concluir,  con  base  a  estos  datos,  que  en  general,  la  prevalencia 
de  diabetes  es  superior  en  mujeres  con  nivel  a  =  0.05.  Aproxime  el  valor-p. 


Relación  entre  intervalo  de  confianza  y  test  de  hipótesis 


Sea  XltX2, . . . ,  Xn  una  m.a.  de  una  distribución  F{9)  y  sea  IC'i_ct(0)  un  intervalo  de  confianza 
de  nivel  1  —  a  para  9,  esto  significa  que: 

P(0  €  ICi-ctf))  =  1  —  a, 

como  vimos  en  el  Capítulo  5. 

Consideremos  el  problema  de  test  de  hipótesis: 


H0:9  =  90  vs.  HA  :  9  ±  90 


si  H0  es  verdadera,  entonces: 

p(e o  G  ICi-a  (0))  =1-0 

lo  cual  implica  que: 

p(o0  i  /<?!_„  (0))  =  o 

Entonces,  podemos  establecer  la  siguiente  regla  de  decisión: 

rechazar  H0  :  9  =  90  a  favor  de  HA  :  9  ^  90  cuando  0O  ^  /C'i_Q(0), 
de  este  modo  construimos  un  test  bilateral  de  nivel  a. 


Ejemplo  7.15 


Consideremos  los  datos  del  Ejemplo  [5l  13,  allí  construimos  un  intervalo  de  confianza  para  la 
concentración  de  ion  nitrato  en  una  muestra  de  agua. 

Si  estamos  interesados  en  saber  si  la  verdadera  concentración  es  53  fig/ml ,  las  hipótesis  a 
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contrastar  son: 


H0  :  p  =  53  vs.  HA:  53 

podemos  construir  un  test  a  partir  del  intervalo  calculado  antes.  La  regla  de  decisión  será  rechazar 
H0  si  53  ^  ICi-a(9).  El  intervalo  de  95%  de  confianza  obtenido  fue  (48.98,  52.16),  y  como  el 
valor  53  no  está  dentro  de  ese  intervalo,  podemos  rechazar  Hq  con  nivel  a  =  0.05  y  la  conclusión, 
a  ese  nivel,  será  que  la  concentración  de  ion  nitrato  en  esa  muestra  no  es  53  /. ig/ml . 
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CAPITULO  8 


Modelo  de  regresión  lineal 


Introducción 


En  capítulos  anteriores,  aún  cuando  analizamos  muestras  de  dos  distribuciones,  nos  interesamos 
en  comparar  sus  parámetros,  pero  no  usamos  la  información  de  una  muestra  para  hacer  inferencias 
sobre  la  otra  distribución.  En  este  capítulo,  veremos  cómo  obtener  información  sobre  una  variable 
(variable  respuesta)  a  partir  del  conocimiento  de  otras  (variables  explicativas). 

En  cursos  de  Análisis  Matemático  se  han  estudiado  relaciones  determinísticas,  si  dos  variables 
x  e  y  están  relacionadas  de  esa  manera,  sabiendo  el  valor  de  x ,  podemos  conocer  exactamente  el 
valor  de  y. 

En  muchas  aplicaciones  encontramos  variables  que  parecen  estar  relacionadas,  aunque  no  de 
manera  determinística.  Esto  significa  que,  saber  el  valor  de  las  variables  explicativas  no  nos  permite 
conocer  exactamente  el  valor  de  la  variable  respuesta,  ya  que  ésta  puede  considerarse  una  variable 
aleatoria;  pero  se  pueden  hacer  inferencias  sobre  la  distribución  de  probabilidad  de  dicha  variable. 
Por  ejemplo,  sean  x  la  edad  de  un  niño  e  y  su  talla,  sabemos  que  la  talla  depende  de  la  edad, 
pero  también  depende  de  muchas  otras  condiciones;  para  una  determinada  edad,  la  talla  puede 
considerarse  como  una  v.a. 

Los  modelos  de  regresión  lineal,  estudian  la  relación  entre  dos  o  más  variables  relacionadas  en 
una  forma  no  determinística. 

El  caso  más  simple  que  estudiaremos  en  este  capítulo,  es  el  modelo  de  regresión  lineal  simple, 
donde  tenemos  una  única  variable  explicativa. 
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Modelo  de  regresión  lineal  simple 


La  relación  matemática  determinística  más  simple  entre  dos  variables  x  e  y,  es  una  relación 
lineal  y  =  1 3o  +  fiix.  El  conjunto  de  pares  (x,  y)  que  verifican  esta  relación,  determinan  una  recta 
con  pendiente  que  corta  al  eje  y  en  /30- 

En  esta  sección  vamos  a  estudiar  una  relación  lineal  no  determinística  entre  dos  variables.  La 
variable  cuyo  valor  fija  el  experimentador  será  denotada  por  a;  y  se  llamará  variable  independiente, 
pronosticadora  o  variable  explicativa.  Con  x  fija,  la  segunda  variable  es  aleatoria  y  se  la  denomi¬ 
na  variable  dependiente  o  respuesta;  esta  variable  aleatoria  la  designamos  como  Y  y  a  su  valor 
observado  lo  designamos  con  y. 

Comenzaremos  analizando  el  siguiente  ejemplo: 


Ejemplo  8.1 


Los  siguientes  valores  provienen  de  un  estudio  sobre  calidad  del  aire  en  una  ciudad,  son  las 
lecturas  sobre  el  volumen  de  tránsito  (en  número  de  automóviles  por  hora)  y  la  concentración 
de  monóxido  de  carbono,  en  un  punto  de  muestreo. 


Vol 

100 

110 

125 

150 

175 

190 

200 

225 

co 

8.6 

9.0 

9.5 

9.6 

10.5 

10.5 

10.9 

10.6 

Vol 

250 

275 

300 

325 

350 

375 

400 

CO 

11.5 

12.4 

12.1 

12.5 

13.0 

13.2 

14.6 

Un  primer  paso  en  el  análisis  de  regresión,  es  construir  una  gráfica  de  puntos  de  los  datos 
observados.  En  una  gráfica  como  esta,  cada  (ay,  yt)  está  representado  como  un  punto  en  un 
sistema  de  coordenadas  bidimensional. 


Ay 


14 
13  - 
12  - 
11  - 
10  - 
9  - 


x 

► 


lio  130  150  170  190  210  230  250  270  290  310  330  350  370  390  410 


Vemos  que  los  puntos  parecen  estar  bastante  próximos  a  una  recta,  y  podemos  aceptar  que 
la  relación  entre  las  variables  es  aproximadamente  lineal.  Esto  significa  que  la  concentración  de 
monóxido  de  carbono  (y¿)  parece  estar  relacionada  linealmente  con  el  volumen  de  tránsito  (ay). 


En  un  problema  general  se  realizan  varias  observaciones.  Sean  xi,x%, . . .  ,xn  los  valores  de 
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la  variable  independiente  y  sean  yi,  yi1 . . . ,  yn  respectivamente,  los  valores  observados  de  la  va¬ 
riable  dependiente  asociados  con  los  x¿.  Los  datos  disponibles  se  componen  entonces  de  los  n 
pares  (xi,  yi),  (x2,  2/2),  ■  •  • ,  (xn,  yn),  que  analizaremos  suponiendo  que  se  verifican  las  hipótesis  del 
siguiente  modelo: 

Definición: 

Para  un  conjunto  de  observaciones  (xi,yi),  (x2,?/2),  ■  •  • ,  (xn,yn),  donde  yt  son  valores  ob¬ 
servados  de  variables  aleatorias  \\  relacionadas  con  las  x¿,  el  modelo  de  regresión  lineal 
simple  se  define  como: 

Yi  =  /3o  +  /?i  Xi  +  (8-1) 

donde  (3o  y  (3\  son  parámetros  fijos  y  los  e¿  son  variables  aleatorias  que  cumplen: 

•  E(cí)  =  0,  *  =  1, . . .  ,n 

•  var(ei)  =  a2,  i  =  1, . . . ,  n 

•  ti  y  Cj  son  independientes  entre  sí,  para  i  ^  j. 


Esto  significa  que,  para  cada  valor  de  la  variable  independiente  o  explicativa  x¿,  la  variable 
dependiente  o  variable  respuesta  Yi ,  es  una  variable  aleatoria  tal  que: 

•  E(Yi)  =  ¡3o  +  (3\Xi,  i  =  l,...,n 

•  var(Y¿)  =  a2,  i  =  1, . . . ,  n 

•  Yi  e  Yj  son  independientes  entre  sí,  para  i  ^  j. 


Estimación  de  los  parámetros  /30  y  /3i 

Según  el  modelo,  los  puntos  observados  se  distribuyen  aleatoriamente  alrededor  de  la 
verdadera  recta  y  =  (3q  +  ¡3ix.  Para  estimar  dicha  recta  se  utilizará  el  método  de  mínimos  cua¬ 
drados. 

Consideremos  una  posible  recta  estimada  y  =  (3o  +  (3ix,  para  cada  valor  x¿  sea  yi  =  (3o  +  (3\Xí 
el  correspondiente  valor  sobre  la  recta  estimada. 

Definiendo  los  residuos  como: 

ri  =  yi-yi  =  Vi-  ( fia  +  0i x¿) ,  (8.2) 

muestran  la  discrepancia  entre  los  valores  observados  y  los  correspondientes  valores  estimados 
y  i  para  cada  x¿,  como  se  muestra  en  el  siguiente  gráfico: 
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X 


O  Xi 

Parece  lógico  pretender  que  esos  residuos  sean  mínimos.  No  podemos  minimizar  cada  residuo 
por  separado,  pero  podemos  minimizarlos  de  manera  global,  minimizando  la  suma  de  los  residuos 
al  cuadrado  (Srr). 

n  n  2 

Srr  =  ^2  ri  =  (Vi  ~  +  PlXi)')  =  h(P0’  #0 

2=  1  2=  1 

Entonces,  el  método  consiste  en  hallar  la  recta  que  minimice  dicha  suma,  ahora  bien,  determinar 
la  recta  equivale  a  determinar  su  pendiente  /3i  y  su  ordenada  al  origen  /?0.  Es  decir,  debemos  hallar 
los  valores  /3q  y  /3i  que  hagan  mínima  Srr  =  /i(/3o,Ál). 

Calculando  las  derivadas  parciales  de  /i(/30,/3i)  respecto  de  /Jo  y  de  /3i  e  igualando  ambas  a 
cero,  se  obtiene  un  sistema  de  dos  ecuaciones,  al  resolverlo,  se  llega  a  la  siguiente  solución: 

3i  =  y  Po=y-xp1 

^XX 

^  n  i  n  n  n 

donde  x  =  -  xiy  y  =  -  ^  y,:,  57JX  =  ^  (x,t  -  x)  y  Sxy  =  ^  (xí  -  x)  (y¿  -  y) . 

2=1  2=1  2  =  1  2=1 

Definición: 

La  recta  obtenida  y  =  fio  +  ¡3\X,  se  llama  recta  de  regresión  estimada  de  y  en  x. 

Una  vez  estimada  la  recta  de  regresión  se  pueden  calcular  los  residuos  (18.211  y  hacer  un  gráfico 
con  los  residuos  en  el  eje  y.  En  la  siguiente  figura  se  muestran  los  gráficos  de  la  recta  estimada  y 


Este  tipo  de  gráfico  nos  permite  verificar  si  las  hipótesis  del  modelo  son  válidas.  Si  el  modelo 
de  regresión  es  correcto,  la  gráfica  de  residuos  no  debería  presentar  ningún  patrón  distinguible. 
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Estimación  de  a 2 


La  varianza  a2  mide  la  variabilidad  inherente  al  modelo  de  regresión.  Una  estimación  de  a2  se 
basará  en  cuánto  se  desvían  las  observaciones  de  la  recta  estimada.  Entonces,  la  varianza  cr2  se 
estima  con  s2  definido  como: 


S2  = 


EILi  (y>  -  (/3o  + 

n  —  2 


n  —  2 


Una  manera  simple  de  calcular  Srr  es  la  siguiente: 


si 

Q  _  c _ E 

íJrr  Uyy 


donde 


n 

sw  =  ^2(ví-  y)2 

i= 1 


La  demostración  es: 

n  2  n 

Srr  =  (?/»  ~  (fío  +  PlX^j  )  =  ^  \yi  ~  (y  ~  +  PlXi) 

2—1  2=1 

n  2  n 

=  [(y*  ~  y)  -  (3i  (xí  ~xi)  =  [(y*  ~yf  - 2  (2/*  -  y)  A.  (*»  -  *)  +  A2  (*»  -  z)2 

2=1  2=1 

C  /  C  \  2  ,^2 

^y  o 

''yy  °xy  <  i  Q  J  ~  u;u;  — '  t/  t/  ^ 


_  c  _ oú  c  _i_/?2o  _ c  _ 9  ^xy  c  \  i  ^xy  \  c  _ c  _ ^y 

^yy  ¿Hl^xy  t  h'\  ^xx  ^yy  ^  ^  ^xy  1  1  „  I  >Jxx  —  ^yy  0 


El  coeficiente  de  determinación 

Una  medida  de  la  variablidad  total  de  las  observaciones  ¡ji  es  la  expresión  que  ya  vimos  Syy, 
parte  de  esa  variabilidad  es  explicada  por  el  modelo  de  regresión.  Pero  como  el  modelo  no  ajusta 
perfectamente  a  los  datos,  queda  una  parte  de  esa  variabilidad  que  es  aleatoria  y  no  puede  ser 
explicada  por  el  modelo.  La  suma  de  cuadrados  de  los  residuos  (Srr),  puede  considerarse  como 
una  medida  de  esa  variabilidad  residual  que  no  es  explicada  por  el  modelo,  obviamente  Syy  >  Srr- 
Entonces,  el  cociente  Srr / Syy  da  la  proporción  de  la  variación  total  en  las  yt  que  no  es  explicada 
por  el  modelo  de  regresión  y  0  <  Srr /Syy  <  1. 

Definición: 

En  un  modelo  de  regresión  lineal,  se  define  el  coeficiente  de  determinación  como: 

2  Srr 

r  ^  ~  ~s 

yy 

y  puede  interpretarse  como  la  proporción  de  la  variabilidad  total  de  las  y.¿  que  es  explicada 
por  el  modelo. 


153 


I 


Observación: 

Es  evidente  que  se  cumple:  0  <  r2  <  1  y  el  coeficiente  de  determinación  es  una 
medida  de  la  bondad  del  ajuste  del  modelo,  un  valor  de  r2  =  1  indicaría  un 
ajuste  perfecto. 


En  la  siguiente  figura  se  muestran  3  gráficos  de  dispersión  diferentes: 


A2/ 


kv 


A  y 


x 

► 


gráfica  a 


gráfica  b 


x 

> 


gráfica  c 


x 

> 


•  si  todos  los  puntos  caen  en  la  recta  de  regresión  (gráfica  a),  el  Srr  =  0  y  r2  =  1 

si  los  puntos  no  caen  exactamente  en  una  recta,  pero  hay  poca  variabilidad  alrededor  de  ella, 
el  r2  será  próximo  1  (gráfica  b) 

•  si  los  puntos  están  más  dispersos  en  relación  a  la  recta  de  mínimos  cuadrados,  la  variación 
explicada  por  la  regresión  es  menor  (gráfica  c),  r2  no  es  tan  próximo  a  1. 


Ejemplo  8.2 


Con  los  datos  del  Ejemplo  8.1,  tenemos  que:  n  =  15,  x  =  236.667,  y  =  11.233, 
Sxx  =  134283.333,  Sxy  =  2314.167  y  Syy  =  41.293.  Luego,  obtenemos  =  0.0173 

y  /?o  =  11.233  —  0.0172  x  236.667  =  7.1623,  así  la  recta  estimada  será: 


lio  130  150  170  190  210  230  250  270  290  310  330  350  370  390  410 


Recordemos  que,  la  pendiente  de  una  recta  es  el  cambio  en  la  variable  y  que  corresponde  a 
un  incremento  unitario  en  la  variable  x.  En  este  modelo,  significaría  el  cambio  esperado  en  Y 
(concentración  de  monóxido  de  carbono)  cuando  el  volumen  de  tránsito  aumenta  en  un  automóvil 
por  hora. 

Estimamos  la  varianza  y  el  coeficiente  de  determinación: 


Srr  =  41.293  -  23141672  =  1.4119, 
134283.333 


s2  =  M119  =  0.1086  y  r2  =  1  —  =  0.9658 
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Esto  significa  que  el  96.58%  de  la  variabilidad  de  la  concentración  de  monóxido  de  carbono, 
puede  explicarse  por  el  modelo  lineal  que  la  relaciona  con  el  volumen  de  tránsito. 


EJERCICIO  8.1 

Demostrar  las  siguientes  igualdades: 

n 

•  ^xx  —  ^  x¿  nx 

í= i 
n 

•  Sxy  =  V!  xíVí  -nxy 

í=i 

n 

•  Syy  =  Yjy1-ny2 

i= 1 

2,  Llegar  a  las  soluciones  de  mínimos  cuadrados. 

3.  Se  realizó  un  experimento  para  observar  el  efecto  de  la  temperatura  de  almacenamiento  en 
la  potencia  de  un  antibiótico.  Tres  porciones  de  una  onza  del  antibiótico  se  almacenaron 
durante  tiempos  iguales  a  cada  una  de  las  siguientes  temperaturas  Fahrenheit:  30°,  50°,  70° 
y  90°.  Las  lecturas  de  potencia  observadas  al  final  del  período  experimental  fueron  como  se 
muestra  en  la  tabla  siguiente. 


Temperatura  ( x ) 

30 

30 

30  50 

50 

50 

70  70 

70 

90 

90 

90 

Lecturas  de  potencia  (y) 

38 

43 

34  32 

26 

33 

19  27 

23 

14 

19 

21 

resumen  de  datos  es:  x  =  60,  y  = 

27.4167,  = 

6000,  Syy 

=  834.9167  y  sxy 

=  -2050. 

a.  Graficar  los  puntos,  estimar  y  graficar  la  recta  de  regresión. 

Calcular  la  proporción  de  la  variabildad  en  las  lecturas  de  potencia  observadas  que  puede 
ser  explicada  por  el  modelo  de  regresión  lineal. 


Definición  y  propiedades  de  los  estimadores  de  los  parámetros 


En  la  sección  anterior  utilizamos  el  método  de  mínimos  cuadrados  para  encontrar  estimaciones 
de  los  parámetros  /3o  y  /3i,  que  son  funciones  de  las  observaciones  Xi  e  y ¿.  Los  valores  aq  se  supone 
que  son  elegidos  antes  de  realizar  el  experimento  y  no  son  aleatorios,  en  cambio,  las  yi  son  valores 
observados  de  las  respectivas  variables  aleatorias  Y¡. 

Reemplazando  en  las  ecuaciones  anteriores  los  valores  y  i  por  las  variables  aleatorias  Y¿,  se 
obtienen  estimadores  de  /3q  y  /3i . 
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Definición: 


Los  estimadores  de  mínimos  cuadrados  de  los  parámetros  /3o  y  /3i  están  dados  por: 

R  =  tXX  =  ELi  (xj-x)  (Yj  -  Y) 

s**  Er=i {vi-*?  ’ 

do  =  y  -  xdi 

Del  mismo  modo,  el  estimador  de  la  varianza  se  obtiene  reemplazando  las  y  i  por  las  Y¿: 


E?=il 

(V¿  - 1 

(do + 0ix¡j 

0 

2 

n 

-  2 

n  —  2  ^ 

V  sxx ) 

Se  puede  probar,  bajo  las  suposiciones  del  modelo  (18.11).  que  los  estimadores  de  mínimos  cua¬ 
drados  /3o  y  0i  son  insesgados,  esto  quiere  decir  que: 

E(0o)=0o  y  E(0 i)=/3i  (8.3) 


y  también  puede  probarse  que: 


var 


(a»)  = 


s2 


VX-  +  J-)  y  var{01)  =  — 


O 

s~. 


(8.4) 


EJERCICIO  8.2 

Demostrar  m  y  m- 


Inferencias  cuando  tiene  distribución  normal 

En  muchas  aplicaciones  se  puede  suponer  que  los  términos  aleatorios  e¿  tienen  distribución 
Normal,  ~  /V(0,cr2),  y  en  consecuencia,  las  variables  aleatorias  Y¿  tienen  distribución  Normal, 
Yi  ~  N(0O  +  0iXi,a2). 

En  ese  caso,  se  pueden  construir  intervalos  de  confianza  y  tests  de  hipótesis  para  los  parámetros. 


Intervalo  de  confianza  y  test  de  hipótesis  para  la  pendiente 


Como  E¿,=i(a;í  —  x)  =  0,  podemos  ver  que: 


01 


Efefe-^¿  t  («,-*)  íy,  =  ¿e,y, 

E“„  fe  - 1)2  ¿í  V E”„  fe  -1)7  ¿í 
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es  decir,  /? i  es  combinación  lineal  de  las  Y¿,  que  son  normales  e  independientes,  y  en  consecuencia, 
tiene  distribución  normal,  es  decir: 


0i  ~  N(j3i,a2 /Sxx)  entonces 


®  I  v~^xx 


N(  0,1) 


Recordemos  que,  cuando  construíamos  un  intervalo  de  confianza  para  la  media  de  una  distribu¬ 
ción  normal  con  varianza  desconocida,  la  función  pivote  utilizada  al  reemplazar  a  por  su  estimador, 
tenía  distribución  de  Student  con  n  —  1  grados  de  libertad.  También  se  puede  demostrar,  aunque 
esta  fuera  del  alcance  de  este  curso,  que: 


0i  -  Pi 

&r  /  v^xx 


T(n_ 


(n— 2) 


Ésta  será  la  función  pivote  que  usaremos  para  construir  un  intervalo  de  confianza  para  la 
pendiente,  con  el  mismo  procedimiento  que  ya  usamos  anteriormente. 

Los  valores  críticos  que  usamos  son  —ta/ 2,n-2  y  ta/2,n-2  y  planteamos: 


P 


~ta/-¿,n-2  < 


Pl-Pl 

Sr  /  \¡  &xx 


<  ta/2,n-2 


=  1  —  a 


y  finalmente  se  llega  al  intervalo: 


ICl-atfl) 


(yPl  ~  ta/2,n-2  x 


i-ñ -  5  Pl  +  ta/ 2,ra-2  X 

V  &XX 


Observación: 

La  longitud  del  intervalo  para  (3±  es  2 ta/2¡n-2Sr/V^xx ,  de  modo  que  la  precisión 
de  la  estimación  para  /3 \  puede  mejorarse  eligiendo  los  valores  xt  más  dispersos 
para  que  Sxx  sea  más  grande. 


Ejemplo  8.3 


Consideremos  los  siguientes  datos  que  muestran  la  densidad  óptica  de  cierta  substancia  (y)  a 
diferentes  niveles  de  concentración  (x). 


X 

80 

120 

160 

200 

240 

280 

320 

360 

400 

440 

480 

520 

y 

0.08 

0.12 

0.18 

0.21 

0.28 

0.28 

0.38 

0.40 

0.42 

0.50 

0.52 

0.60 
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A  y 


0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

0 


H h 


X 

- T - , - , - , - , - , - , - , - , - , - , - , - , -  V 

110  140  170  200  230  260  290  320  350  380  410  440  470  500  530 


Vemos  que  los  puntos  parecen  estar  bastante  próximos  a  una  recta  y  podemos  aceptar  que 
la  relación  entre  las  variables  es  “aproximadamente  lineal” .  Podemos  pensar  que  para  cada 
concentración  (cc¿),  el  valor  de  la  densidad  óptica  (y i)  es  función  lineal  de  x ¿  más  un  término 
aleatorio,  que  suponemos  que  tiene  distribución  normal  y  se  cumplen  las  hipótesis  enunciadas 
del  modelo  de  regresión  lineal. 

En  este  caso  n  =  12  y  con  esos  datos:  x  =  300,  y  =  0.3308,  Sxx  =  228800,  Syy  =  0.3019, 
Sxy  =  261.4,  entonces 


Pi 


261-4  =  0.0011  y  3o  =  0.3308  -  0.0011  x  300  =  0.0008 
228800  J 


de  modo  que  la  recta  de  regresión  estimada  será: 


y  =  0.0008  +  0.0011  x 


esto  significa  que  al  aumentar  la  concentración  en  1  unidad,  la  densidad  óptica  aumenta  en 
0.0011.  Si  graficamos  estos  valores  junto  con  la  recta  de  regresión  estimada  tenemos: 


Para  estimar  er  según  esos  datos:  Srr  =  0.3019  —  261.42/228800  =  0.0032  y  luego, 

sr  =  ^  2^32  =  0.0  1  79. 

El  coeficiente  de  determinación  es  r2  =  1  —  =  1  —  0.0106  =  0.9894,  esto  significa  que  el 

modelo  de  regresión  lineal  simple  explica  el  98.94%  de  la  variabilidad  total  de  las  observaciones 


2/i- 

Para  construir  un  intervalo  de  confianza  para  la  pendiente  de  nivel  1  —  a  =  0.95  buscamos 
ío. 025, ío  =  2.2281  y  el  intervalo  de  confianza  queda: 


ICosaiPi)  =  0.0011  ±  2.2281  x  0.0179/V228800  =  (0.00102, 0.00118) 
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Si  se  desea  plantear  algún  test  de  hipótesis  sobre  la  pendiente  /3i,  donde  la  hipótesis  nula  es 
que  (3i  es  un  valor  fijo  6,  el  estadístico  de  prueba  será: 


Pi-b 


r  / V  SXx 


T(n- 2)  si  H0  es  verdadera 


Los  diferentes  tests  que  se  pueden  hacer  se  resumen  como: 


RESUMEN  8.1 


Bajo  el  modelo  de  regresión  lineal  =  / 3o  +  +  e¿, 

con  e¿  ~  N(0,a2)  e  independientes  entre  sí. 

Hipótesis  nula 

Hq  '■  Pi  —  b 

Valor  del  estadístico 

de  prueba 

,  Pi-b 

/  y/ 

Hipótesis  alternativa 

Ha  :  /3,  <  b 

Ha.  Pi  >b 

Ha  ■  Pi  ^  b 

Región  de  rechazo  con 

nivel  a 

t  ^  ta,n— 2 

t  ^  ta,n—2 

|f|  >  ta/2,n-2 

Ejemplo  8.4 


Para  los  datos  del  Ejemplo  8.3,  si  queremos  verificar,  con  nivel  de  significación  a  =  0.05,  que  la 
pendiente  /3i  <  0.00115,  debemos  plantear: 

Hq  :  /3i  =  0.00115  vs.  HA  :  f3±  <  0.00115 


El  estadísitico  de  prueba  es: 


T  = 


/3i  -  0.00115 


'■  /  V  SXx 


T(10)  si  Hq  es  verdadera 


la  región  de  rechazo  es: 


t  <  —  ío.05,io  —  —1-8125 

Resolviendo  t  =  (0.0011  -  0.00115)  x  \/228800/0.0179  =  -4.0085.  Como 

—4.0085  <  —1.812  podemos  rechazar  Hq  con  nivel  a  =  0.05,  es  decir,  podemos  afirmar  que 
la  pendiente  es  menor  que  0.00115  con  ese  nivel. 
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Intervalo  de  confianza  y  test  de  hipótesis  para  la  ordenada  al  origen 


Si  deseamos  hacer  inferencias  sobre  /?o  veremos  primero  cuál  es  la  distribución  de  su  estimador. 
Para  eso  veremos  que  /3q  se  puede  escribir  como: 


=  Y  —  x/3i  = 


J27=  i  Yi  i  (xi  -  x )  Yix 


Sr. 


1  {xi~x)x'}Yi 


i=  1 


Sx 


Por  lo  tanto,  /3o  es  una  combinación  lineal  de  las  Y¡  que  son  independientes  y,  si  tienen  distri¬ 
bución  Normal,  también  /3o  tiene  distribución  Normal  con  la  media  y  varianza  que  ya  vimos,  es 
decir: 


/3o~3V(/30,^(  -  +  ^~ 

TI  ^XX 


entonces  — ~  N  (0, 1) 


a 


Ti  '  SXx 

Luego  si  queremos  construir  un  intervalo  de  confianza  para  /3o,  la  función  pivote  que  debemos 
usar  es: 


Á)  —  A) 


T, 


(n~  2) 


Siguiendo  el  procedimiento  usual,  llegamos  al  intervalo: 


tC'i_a(/3o)  —  I  /3o  —  ta/2  n-2  x  Sr  \ - b  7; -  ,  /3o  +  ¿a/2,ra-2  X  Sr  \ - b  77 — 

1  \  n  bxx  \  n  bxx 


Observación: 

La  longitud  del  intervalo  para  /3o  es  2íQ/2,n-2  x  sr^l/n  +  x2  /  Sxx  de  modo  que, 
si  /r  es  relativamente  grande,  la  estimación  de  /3o  será  poco  precisa.  Generalmen¬ 
te,  la  estimación  de  /3q  no  es  tan  importante  como  la  de  /3i . 


Ejemplo  8.5 


Para  los  datos  del  Ejemplo  8.3,  si  elegimos  1  —  a  =  0.95,  ¿o. 025,10  =  2.2281  y  el  intervalo  para  /3o 
es: 

/  1  3QQ2 

ICo.M)  =  0.0008  ±  2.2281  x  0.0179  x  ^  ^  =  (-0.0267, 0.0283) 


De  la  misma  forma  se  pueden  plantear  tests  para  /3q,  pero  en  general,  es  de  menor  interés. 
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EJERCICIO  8.3 


Para  calibrar  un  método  analítico,  se  realizaron  determinaciones  de  magnesio  en  6  muestras  con 
concentraciones  conocidas.  Los  valores  obtenidos  fueron: 


Concentración  ( ppm ) 

0  2  4  6  8  10 

Respuesta 

114  870  2087  3353  3970  4950 

Hallar  un  intervalo  de  confianza  para  la  pendiente  de  nivel  0.95. 


Inferencias  en  relación  a  la  media  y  pronóstico  de  la  variable  respuesta 
(Y)  correspondiente  a  un  valor  x0  de  la  variable  explicativa 

Consideremos  Xq  un  valor  de  la  variable  explicativa  y  sea  lo  Ia  respuesta  correspondiente.  Si 
se  cumple  el  modelo  y  xq  está  dentro  del  rango  de  las  observaciones  con  las  que  se  estimó  la  recta, 
la  respuesta  media  correspondiente  a  xq  es: 

E(Yq)  =  (30  +  (3\Xq 


El  “valor  ajustado”: 

2/o  =  fio  +  P\X0 

se  puede  considerar  un  estimador  de  E(Yq). 

Si  deseamos  construir  un  intervalo  de  confianza  para  E  (lo),  deberemos  encontrar  la  función 
pivote  adecuada.  Es  fácil  ver  que: 

E(yo)  =  E0 o  +  Pixo)  =  Po  +  PiXo 


y  que: 


1  (x0  -  x)2 


y  {yo)  =  V(Po  +0lXo)  =  a  -  + 

\  n  s. 


También  se  puede  probar  que,  cuando  las  Yt  tienen  distribución  Normal,  la  función: 

Vo  -  (/3o  +  Pixo) 


(Xp—X)2 


Trn_ 


(n— 2) 


Entonces,  esa  es  la  función  pivote  que  usamos  para  construir  un  intervalo  de  confianza  para 
E  (lo).  Siguiendo  el  mismo  procedimiento  de  siempre,  obtenemos  el  siguiente  intervalo  de  confianza 
de  nivel  1  —  a  para  la  media  de  Y .  para  un  valor  dado  xq: 


ICx-a(E(Y0)) 


^2/0  ta/21n—2^r 


{x0-x)2  ^  |  ^  / 1  ,  {xo-x)2 

- q - 5  yo  +  ta/2,n-2sr\ - 1 - q - 

xx  V  TI  ^xx 


(8.5) 
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Ejemplo  8.6 


Para  los  datos  del  Ejemplo  8.3,  si  queremos  estimar  la  densidad  óptica  media  que  corresponde 
a  una  concentración  Xq  =  350,  primero  calculamos  yo  =  0.0008  +  0.0011  x  350  =  0.3858  y  el 
dt  (yo)  =  i JV (yo)  =  sr\j  ^  =  0.0179  x  \J A  +  -^ssoo ^  =  0-0055,  con  el  valor  crítico 

ío. 025,10  =  2.2281  el  intervalo  de  confianza  es: 

ICq.95  (. E(Y0 ))  =  0.3858  ±  2.2281  x  0.0055  =  (0.3735, 0.3981) 


A  partir  del  intervalo  (18.51).  vemos  que  la  longitud  es: 


L  =  2 1 


a/2,n—2^r 


(8.6) 


Esta  longitud  es  mínima  cuando  xo  es  igual  a  x  y  aumenta  cuando  Xo  se  aleja  de  x.  En  la  siguiente 
figura,  se  gráfica  la  recta  de  regresión  estimada  (con  los  datos  del  Ejemplo  8.6)  y  dos  lineas  curvas 
que  representan  los  límites  de  los  intervalos  de  confianza  para  la  media  de  Y,  dados  los  posibles 
valores  de  x. 


En  el  gráfico,  se  puede  ver  cómo  varía  la  longitud  de  los  intervalos  de  confianza. 


Observación: 

Generalmente,  el  modelo  es  una  aproximación  válida,  en  el  mejor  de  los  casos, 
dentro  del  rango  de  las  “a;”  usadas  en  el  experimento.  No  tenemos  información 
para  hacer  ninguna  inferencia  fuera  de  ese  rango  de  valores,  por  lo  que  no  es 
nada  confiable  “extrapolar” ,  o  sea,  aplicar  este  procedimiento  para  Xq  fuera  del 
rango  de  las  “x"  con  las  que  se  estimó  la  recta  de  regresión. 
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Si  queremos  predecir  el  valor  que  puede  tomar  la  respuesta,  cuando  la  variable  explicativa  es 
Xo,  sabemos  que  Yq  =  ¡3q  +  fiiXo  +  e,  parece  lógico  predecir  ese  valor  con  el  valor  sobre  la  recta 
estimada,  o  “valor  ajustado”: 

ÍJo=Po  +  Pixo 

éste  es  el  mismo  valor  que  usamos  para  estimar  la  E(Yq).  Pero,  si  pretendemos  construir  un 
intervalo  de  predicción,  las  cosas  cambian  un  poco.  El  error  de  predicción  es  la  diferencia  entre  el 
valor  que  puede  tomar  una  variable  aleatoria  Yq  y  el  valor  ajustado  yo,  podemos  ver  que  el  valor 
esperado  del  error  de  predicción  es: 

E(Yo-yo)  =  0 

y  la  varianza  del  error  de  predicción  es: 

V(Y0  -  yo)  =  V(Y0)  +  V(y0)  =  a2(l  +  -+  (ar°  ~  g)2>\ 

\  TI  ^XX  J 


Observación: 

El  valor  futuro  de  Y  es  independiente  de  las  Y,¡  observadas  anteriormente. 


Así,  para  construir  un  intervalo  de  predicción  para  Yq  usaremos  la  función: 

Y0  -  yo 


^/1  +  l  +  M 


T(n- 2) 


y  el  intervalo  de  predicción  para  1q  es: 


/  1  (xn  —  X^ 

IP\-a(Yo)  =!/0±  ta/2,n-2  sr\  1  H - 1 - ^ - 

V  TI  &XX 


(8.7) 


Ejemplo  8.7 


Con  los  datos  del  Ejemplo  8.3,  si  queremos  hacer  un  intervalo  de  predicción  para  un  posible  valor 
de  la  densidad  óptica  correspondiente  a  la  misma  concentración  Xq  =  350,  el  valor  yo  es  el  mismo, 
pero  dtÍYÓ^yo)  =  s/V(Y^yo)  =  sry/ 1  +  ¿  +  =  0.0179  x  yjl  +  ¿  =  0.0187. 

Luego,  el  intervalo  de  predicción  será: 

IPo.9b(Y0)  =  0.3858  ±  2.2281  x  0.0187  =  (0.3441, 0.4275) 

esto  significa  que  tenemos  un  95  %  de  confianza  de  que  ese  intervalo  contenga  a  la  posible 
respuesta  lo  correspondiente  a  una  concentración  xo  =  350. 

I 

La  longitud  del  intervalo  de  predicción  para  lo  m  es 

r  _  .  L  ,  1  ,  (X0~X)2 

L  ~  ¿*ot/2,n-2  sr\  1  H - 1 - ^ - 

y  TI  &xx 
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Vale  lo  mismo  que  dijimos  para  los  intervalos  de  confianza,  la  longitud  es  mínima  cuando  xq  es 
igual  a  x.  Además,  la  longitud  de  este  intervalo  es  mayor  que  la  del  intervalo  de  confianza  para 
E(Y0)  (18.61).  Ésto  es  lógico  porque,  para  predecir  el  valor  que  tome  la  variable  aleatoria  tengo 
más  incertidumbre  que  para  estimar  su  media.  Podemos  visualizar  ésto  con  los  datos  del  ejemplo 
anterior.  En  la  siguiente  figura  se  observan  los  puntos  (x¿,  y¿),  la  recta  de  regresión  estimada  (línea 
sólida  de  color  azul),  dos  pares  de  curvas  que  representan  los  límites  de  los  intervalos  de  confianza 
(líneas  de  rayas  de  color  rojo)  y  los  intervalos  de  predicción  (líneas  de  rayas  de  color  verde). 


EJERCICIO  8.4 

Para  los  datos  del  Ejercicio  8.3  construir,  si  es  posible,  un  intervalo  para  la  respuesta  media  y  de 
predicción  de  nivel  0.95  para  x  =  3,  7  y  12. 


Curva  de  calibración 

Un  ejemplo  particular  del  uso  de  un  modelo  de  regresión  lineal  es  construir  una  curva  de  cali¬ 
bración.  Una  vez  establecida  la  curva  de  calibrado,  ésta  puede  usarse  para  obtener  la  concentración 
del  analito,  correspondiente  a  cualquier  material  de  ensayo.  Por  este  motivo,  es  importante  que 
los  patrones  que  se  usan  para  construir  la  curva  cubran  el  intervalo  completo  de  concentraciones 
requerido  en  subsiguientes  análisis. 

El  procedimiento  habitual  es  el  siguiente:  el  analista  toma  una  serie  de  materiales  con 
concentraciones  del  analito  conocidas  x±,  X2,  •  •  • ,  xn.  Estos  patrones  de  calibración  se  miden 
en  el  instrumento  analítico  bajo  las  mismas  condiciones  que  las  utilizadas  posteriormente 
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para  los  materiales  de  ensayo  (es  decir,  los  “desconocidos”),  obteniéndose  los  valores  yi,  1/2,  •  ■  ■ ,  Un- 
Luego,  se  gradean  los  n  pares  (xi,yi),  (x%, 2/2)1  ■  ■  ■ ,  ( xn,yn )  y  se  observa  si  están  próximos  a  una 
curva. 

La  primera  cuestión  que  se  plantea  es  si  la  curva  de  calibración  es  lineal.  En  este  curso  solamente 
analizaremos  el  caso  de  una  recta,  pero  hay  procedimientos  similares  para  ajustar  otro  tipo  de 
curvas. 

En  el  caso  de  observar  linealidad,  es  válido  asumir  el  modelo  de  regresión  lineal: 

Yi  =  /3o  +  fiiXi  +  e¿ 

donde  /3o  y  /3 1  son  parámetros  fijos  y  los  e¿  son  errores  de  medición  aleatorios  independientes  entre 
sí,  y  en  consecuencia,  podemos  suponer  que  tienen  distribución  normal,  ~  3V(0,  a2). 


Ejemplo  8.8 


Para  construir  una  curva  de  calibración,  se  han  examinado  una  serie  de  soluciones  patrones  de 
fluorescencia  en  un  espectrómetro  de  fluorescencia  y  han  conducido  a  las  siguientes  intensidades 
de  fluorescencia  (en  unidades  arbitrarias): 


intensidad  de  fluorescencia 

2.1 

5.0 

9.0 

12.6 

17.3 

21.0 

24.7 

concentración  pg  mi —  1 

0 

2 

4 

6 

8 

10 

12 

Si  graficamos  estos  valores: 


24 

20 

16 

12 


hy 


4 


0 


4 


6 


8 


10 


12 


X 


vemos  que  los  puntos  parecen  estar  bastante  próximos  a  una  recta  y  podemos  aceptar  que 
la  relación  entre  las  variables  es  “aproximadamente  lineal”.  Podemos  estimar  los  parámetros 
desconocidos  An  Pi  y  v2  ■ 

Tenemos  que:  Sxx  =  112,  Sxy  =  216.2,  Syy  =  418.28,  Srr  =  0.9368,  x  =  6  y  y  =  13.1.  Luego, 
obtenemos  /3q  =  1.5179  y  /?i  =  1.9304,  así  la  recta  estimada  es: 
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Si  queremos  construir  un  intervalo  de  confianza  para  la  pendiente,  debemos  calcular 
dt{0\ )  =  sr/y/Sxx  =  0.4329/vTL2  =  0.0409  eligiendo  1  —  a  =  0.95  tenemos  ío.025,5  =  2.5706  y 
el  intervalo  para  0\  es: 

ICoMPi)  =  1-9304  ±  2.5706  x  0.0409  =  (1.8253, 2.0355) 

Ahora,  si  elegimos  Xq  =  5,  se  tiene  que  yo  =  1-5179  +  1.9304  x  5  =  11.1699, 

dt(yo)  =  0.4329  x  \J  \  +  =  0.1687  y  el  intervalo  de  95%  de  confianza  para  E(Y0 )  re¬ 

sulta: 

ICo.95(E(Y0 ))  =  11.1699  ±  2.5706  x  0.1687  =  (10.7362, 11.6036), 

esto  significa  que  tenemos  un  95  %  de  confianza  de  que  este  intervalo  contenga  el  valor  ver¬ 
dadero  (desconocido)  de  E(Y0),  que  es  el  valor  medio  de  las  respuestas  correspondientes  a  la 
concentración  x9  =  5. 

También  se  puede  construir  un  intervalo  de  predicción,  por  ejemplo,  para  x  =  9  obtendremos: 
IPo.9b(yo)  =  18.8915  ±  2.5706  x  0.2045  =  (18.3658, 19.4172) 


Estimación  de  un  valor  de  a:  a  partir  de  un  valor  de  y 


La  curva  de  calibración,  luego  de  analizar  si  se  ajusta  al  modelo  lineal,  se  usa  para  conocer  la 
verdadera  concentración  ( x9 )  correspondiente  a  una  señal  medida  en  el  instrumento  (yo);  ahora 
bien,  si  se  tratara  de  un  modelo  determinístico,  se  podría  despejar  zq  de  la  ecuación: 


resultando: 


2/o  =  /3o  +  P1X0 

2/o  -  0o 


x0  = 


(3i 


Pero  estamos  trabajando  con  una  recta  estimada: 

Vo  =00+  0\Xo 

donde  yo,  0o  y  0i  son  variables  aleatorias.  Entonces,  estimamos  el  valor  xq  como: 

y0  -0o  Vo-  (Y  -  x0i )  y0  -  Y  +  x0x 


x0  = 


01 


0i 


01 _ 

yo -Y 

=  - ^ - h  X 

01 

Luego  Xq  es  una  variable  aleatoria,  ya  que  es  función  de  yo,  Y  y  0i,  que  son  variables  aleatorias. 
Si  queremos  tener  una  idea  de  la  precisión  de  esta  estimación,  recordando  el  tema  de  propagación 
de  errores  (visto  en  el  Capítulo  [4} ,  podemos  aproximar  la  desviación  estándar  de  xo : 


dm)s°  l+L  +  («°zjpr 

01  X  n  0ÍSxx 
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y  podemos  estimarla  con: 


dt  (í0) 


£r  A,!,  (yo  -  y)2 

Pi  V  n  Plsxx 


Observación: 

A  partir  de  la  fórmula,  se  puede  observar  que  la  desviación  estándar  es  menor 
cuanto  más  cerca  está  el  valor  yo  del  valor  y  calculado  con  los  datos  usados  para 
construir  la  curva  de  calibración. 


Ejemplo  8.9 


Volvamos  con  los  datos  del  Ejemplo  8.8.  Determinaremos  para  los  siguientes  tres  valores  de 
fluorescencia:  2.9,  13.5  y  23,  su  concentración  estimada  y  su  desviación  estándar  aproximada, 
que  se  muestran  a  continuación: 


Valor  de  fluorescencia 

concentración  estimada 

desviación  típica  aproximada 

yo  =  2.9 

_  2.9—1.5129  _  n 

X°  —  1.9304  —  0.7160 

0.4329  /1  ,  1  ,  (2.9-13.1)2  _02fi46 

1.9304  V  1  7  1  1.93042x112  U.Z040 

yo  =  13.5 

*0  =  131:9^o54129  =  6-2071 

0.4329  /lili  (13. 5-13. 1)2  _  q  2198 
1.9304  y  1  1  7  1  1.93042  x  112  —  U.zoao 

Vo  =23 

ío  =  23-;^04129  =  11-1283 

0.4329  / 1  i  1  i  (23.0— 13. 1)2  ^  oííqo 

1.9304  V  1  +  7  +  1.93042  x  112  ~ 

Gráficamente 
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EJERCICIO  8.5 


La  respuesta  de  un  ensayo  colorimétrico  para  glucosa  se  controló  con  la  ayuda  de  soluciones  patrón 
de  glucosa.  A  partir  de  la  siguiente  muestra: 


Glucosa  ( nM ) 

0 

2 

4 

6 

8 

10 

Absorbancia 

0.002 

0.150 

0.294 

0.434 

0.570 

0.704 

Hallar,  si  es  posible,  para  los  siguientes  valores  de  absorbancia:  0.3,  0.5  y  0.9,  los  valores  estimados 
de  glucosa  y  sus  respectivos  errores  estándar. 
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APÉNDICE  A 
Teoría  de  Conjuntos 


Aquí  no  se  darán  las  explicaciones  teóricas  de  la  Teoría  de  Conjuntos,  pues  se  pueden  encontrar 
en  cualquier  texto  básico  de  Álgebra,  sino  que  se  hará  un  repaso  de  los  conceptos  básicos  que  se 
requieren,  algo  así  como  un  “ayuda  memoria”. 

A  continuación  se  repasarán  las  definiciones  y  propiedades  básicas: 

Definición: 

Dado  un  conjunto  A  =  {a,  b ,  c,  d},  la  pertenencia  del  elemento  a  al  conjunto  A  se  representa 
por  a  £  A. 


Definición: 

Se  llama  cardinal  del  conjunto  al  número  de  elementos  que  contiene,  notamos  #  A. 


Definición: 

Se  llama  conjunto  vacío,  y  se  representa  por  0,  al  conjunto  que  no  contienen  ningún 
elemento. 


Definición: 

Se  llama  universo  o  conjunto  universal,  y  se  suele  representar  por  Í2,  al  conjunto  formado 
por  todos  los  elementos  que  se  están  considerando. 


169 


Definición: 


Dado  un  conjunto  A,  se  llama  complemento  del  mismo,  y  se  representa  por  Ac  o  A! ,  al 
conjunto  formado  por  los  elemntos  del  universo  que  no  están  en  A. 


Aclaración 

Dos  conjuntos  son  iguales  si  están  formados  por  los  mismos  elementos. 


Definición: 

Se  dice  que  B  es  subconjunto  de  A,  y  se  representa  B  C  A,  si  todos  los  elementos  de  B 
pertenecen  a  A.  Se  dice  también  que  B  está  incluido  en  A. 


Definición: 

Dados  dos  conjuntos  A  y  B,  se  llama  unión  de  ambos,  y  se  representa  A\J  B,  al  conjunto 
formado  por  los  elmentos  que  pertenecen  &  A  o  a,  B. 


Definición: 

Dados  dos  conjuntos  A  y  B1  se  llama  intersección  de  ambos  y  se  representa  A  D  B1  al 
conjunto  formado  por  los  elementos  que  pertenecen  a  A  y  a  B. 


Definición: 

Si  dos  conjuntos  no  tienen  elementos  comunes,  se  llaman  disjuntos,  incompatibles  o 
mutuamente  excluyentes  y  su  intercción  es  el  conjunto  vacío. 


Definición: 

Dados  dos  conjuntos,  A  y  B,  la  diferencia  entre  A  y  i?  es  el  conjunto  de  los  elementos  que 
están  en  A  y  no  están  en  B  y  se  representa  por  A  —  B. 


A  continuación  repasaremos  algunas  propiedades  básicas: 
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PROPIEDADES  DE  LA  INCLUSIÓN: 

•  0  c  a  c  n 

•  Reflexiva:  ACA 

Antisimétrica:  A  C  B  y  B  C  A  implica  A  =  B 
Transitiva:  A  C  B  y  B  C  D  implica  A  C  D 

•  AnB  C  Ay  AnB  C  B 

•  A  fl  B  =  A  entonces  A  C  B 

•  AnB  C  AU  B 


PROPIEDADES  DE  LA  UNIÓN  E  INTERSECCIÓN: 

•  Identidad:  AU0  =  A,  AUÍ2  =  Í7,  AníI  =  AyAn0  =  0 

•  Idempotencia:  AuA  =  AyAnA  =  A 

•  Conmutatividad:  A\JB  =  BuAyAnB  =  BnA 

Asociatividad:  (ALI  B)  \J  D  =  ALI  (B  Ll  D)  y  (A  n  B)  n  D  =  A  n  (B  n  D ) 
Distributividad:  (A  U  B)  fl  D  =  (A  fl  D)  U  (B  fl  D)  y  (A  fl  B)  U  D  =  (A  U  D)  fl  (B  U  D) 

•  Absorción:  AA  (An  B)  =  A  y  An  (An  B)  =  A 

•  Complementaridad:  AA  Ac  =  Ti  y  An  Ac  =  t¡) 


PROPIEDADES  DEL  COMPLEMENTO: 

•  (Ac)c  =  A,  0C  =  íl  y  nc  =  0 

•  A  C  B  entonces  Bc  C  Ac 

Leyes  de  De  Morgan:  (A  U  B)c  =  Ac  fl  Bc  y  (A  fl  B)c  =  Ac  A  Bc 

•  A-B  =  AnBc  =  A-  (Aflfi) 
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PROPIEDADES  DE  LA  DIFERENCIA: 

•  A  -  A  =  0,  A  -  0  =  A,  A  -  ÍI  =  0,  0-A  =  0yft-A  =  Ac 
• A-B C A 

•  A  —  B  =  A  entonces  A  n  R  =  0 

•  (A-  B)  -  D  =  (A- D)  -  B 

•  An(B-D)  =  (Anfl)-(AnD) 
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APENDICE  B 


Tablas 


Aquí  se  encuentran  las  Tablas  de  algunas  distribuciones  utilizadas  en  este  libro.  Los  resultados 
fueron  redondeados  a  4  decimales.  A  continuación  se  dará  una  breve  descripción  del  uso  de  las 
mismas: 

Probabilidades  acumulativas  Binomial:  se  tabulan  los  valores  de  la  fda  de  la  v.a. 
X  ~  B(n,p).  Hay  una  tabla  para  cada  uno  de  los  siguientes  valores  de  n  =  5,  10,  15,  20  y 
25,  y  en  cada  una,  los  valores  de  p  son:  0.01,  0.05,  0.1,  0.2,  0.25,  0.3,  0.4,  0.5,  0.6,  0.7,  0.75, 
0.8,  0.9,  0.95  y  0.99,  que  se  encuentran  en  la  primera  fila.  En  la  primera  columna,  titulada  k, 
se  encuentran  los  posibles  valores  de  la  v.a.  en  este  caso  k  es  un  valor  natural  entre  0yn-l 
(es  claro  que  F(n)  =  1,  por  eso  este  valor  se  omite).  En  las  restantes  columnas  se  tabulan  los 
valores  de  F(k)  correspondientes  a  los  distintos  valores  de  p.  Por  ejemplo,  si  X  ~  B{ 5,0.75) 
obtenemos  que  F( 3)  =  0.3672  como  se  muestra  la  siguiente  gráfica  que  corresponde  a  un 
fragmento  de  la  original. 


Binomial  con  n  =  5 


k 

0.01 

0.05 

0.10 

0.20 

0.25 

0.30 

0.40 

0.50 

0.60 

0.70 

0. 

75 

0.80 

0.90 

0.95 

0.99 

0 

0.9510 

0.7738 

0.5905 

0.3277 

0.2373 

0.1681 

0.0778 

0.0313 

0.0102 

0.0024 

o 

o 

)10 

0.0003 

0.0000 

0.0000 

0.0000 

1 

0.9990 

0.9774 

0.9185 

0.7373 

0.6328 

0.5282 

0.3370 

0.1875 

0.0870 

0.0308 

q 

o 

L56 

0.0067 

0.0005 

0.0000 

0.0000 

2 

1.0000 

1. (]()()(] 

0.9988 

1.0000 

0.9914 

0.9421 

0.9033 

0.8965 

0..L.11 

0.8369 

0.6826 

0.9130 

0.5000 

0.Q12C 

0.3174 

0.1631 

0.1. 10 

0.1 

)35 

67- 

0.0579 

0.202  ( 

0.0086 

0.081u 

0.0012 

0.0000 

0.0010 

4 

1.0000 

1.0000 

1.0000 

0.9997 

0.9990 

0.9976 

0.9898 

0.9688 

0.9222 

0.8319 

0.7627 

0.6723 

0.4095 

0.2262 

0.0490 

•  Probabilidades  acumulativas  de  Poisson:  se  tabulan  los  valores  de  la  fda  de  la  v.a. 
X  ~  P( A).  En  la  primera  fila  se  encuentran  los  siguientes  valores  de  A:  0.1,  0.2,  0.3,  0.4, 
0.5,  0.6,  0.7,  0.8,  0.9,  1,  2,  3,  4,  5,  6,  7,  8,  9,  10,  12,  15,  17,  20  y  25.  En  la  primera  columna 
se  encuentran  los  posibles  valores  de  la  v.a.,  en  este  caso  k  =  0,1,2,....  En  las  restantes 
columnas  se  tabulan  los  valores  de  F(k)  correspondientes  a  los  distintos  valores  de  A.  Por 
ejemplo,  si  A'  ~  P(0.9),  tenemos  que  que  F( 5)  =  0.9997  (como  se  muestra  la  siguiente  gráfica 
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que  corresponde  a  un  fragmento  de  la  original). 


Poisson 


k 

0.1 

0.2 

0.3 

0.4 

0.5 

0.6 

0.7 

0.8 

0 

9 

1 

2 

3 

4 

0 

0.9048 

0.8187 

0.7408 

0.6703 

0.6065 

0.5488 

0.4966 

0.4493 

0.4 

)66 

0.3679 

0.1353 

0.0498 

0.0183 

1 

0.9953 

0.9825 

0.9631 

0.9384 

0.9098 

0.8781 

0.8442 

0.8088 

0.7 

725 

0.7358 

0.4060 

0.1991 

0.0916 

2 

0.9998 

0.9989 

0.9964 

0.9921 

0.9856 

0.9769 

0.9659 

0.9526 

0.9 

371 

0.9197 

0.6767 

0.4232 

0.2381 

3 

1.0000 

0.9999 

0.9997 

0.9992 

0.9982 

0.9966 

0.9942 

0.9909 

0.9 

365 

0.9810 

0.8571 

0.6472 

0.4335 

4 

1.0000 

1.0000 

0.9999 

0.9998 

0.9996 

0.9992 

0.9986 

0.9 

>77 

0.9963 

0.9473 

0.8153 

0.6288 

*97 

0 

6 

1.0000 

1.0000 

1.0000 

0.9999 

0.9955 

0.9665 

0.8893 

Función  de  Distribución  Normal  Típica:  se  tabulan  los  valores  de  $(2)  =  P(Z  <  z) 
para  la  v.a.  Z  ~  N(0, 1)  y  los  valores  disponibles  de  z  son  los  números  reales  entre  -3.59  y 
3.59  expresados  con  dos  decimales.  En  la  primer  columna  se  indica  la  parte  entera  y  el  primer 


decimal  y  en  la  primer  fila  el  segundo  decimal  del  número  z.  Por  ejemplo,  si  necesitamos  el 


valor  de  $(—2.92)  =  0.0018  (como  se  muestra  en  la  siguiente  gráfica  que  es  un  fragmento  de 


la  original). 


Normal  estándar 


z 

0.00 

0.01 

-3.5 

0.0002 

0.0002 

-3.4 

0.0003 

0.0003 

-3.3 

0.0005 

0.0005 

-3.2 

0.0007 

0.0007 

-3.1 

0.0010 

0.0009 

-3.0 

0.0013 

0.0013 

-2.8 

0.0026 

0.0025 

0.02 

0.0  )02 
0.0  )03 
0.0  )05 
0.0  )06 
0.0)09 
0.0  )13 
0.0018 
0.0024 


0.03  0.04  0.05  0.06  0.07  0.08  0.09 


0.0002 

0.0003 

0.0004 

0.0006 

0.0009 

0.0012 

0.0017 

0.0023 


0.0002 

0.0003 

0.0004 

0.0006 

0.0008 

0.0012 

0.0016 

0.0023 


0.0002 

0.0003 

0.0004 

0.0006 

0.0008 

0.0011 

0.0016 

0.0022 


0.0002 

0.0003 

0.0004 

0.0006 

0.0008 

0.0011 

0.0015 

0.0021 


0.0002 

0.0003 

0.0004 

0.0005 

0.0008 

0.0011 

0.0015 

0.0021 


0.0002 

0.0003 

0.0004 

0.0005 

0.0007 

0.0010 

0.0014 

0.0020 


0.0002 

0.0002 

0.0003 

0.0005 

0.0007 

0.0010 

0.0014 

0.0019 


•  Valores  críticos  para  la  distribución  Student:  se  proporcionan  los  valores  críticos  ta<n 
donde  n  son  los  grados  de  libertad  (g.l.).  Los  g.l.  disponibles  son:  del  1  al  35,  40,  50,  60, 
100,  120  y  muy  grande  (00),  indicados  en  la  primera  columna,  y  los  valores  de  a  son:  0.1, 
0.08,  0.05,  0.025,  0.01,  0.005,  0.0025,  0.001,  0.0008  y  0.0005,  indicados  en  la  primera  fila. 
Por  ejemplo,  si  necesitamos  averiguar  el  valor  crítico  de  io.0025,4;  obtendremos  el  valor  5.5976 
como  se  muestra  a  continuación: 


Student 


g-1- 

0.1000 

0.0800 

0.0500 

0.0250 

0.0100 

0.0050 

0.0 

)25 

0.0010 

0.0008 

0.0005 

1 

3.0777 

3.8947 

6.3138 

12.7062 

31.8205 

63.6567 

127. 

5213 

318.3088 

397.8865 

636.6192 

2 

1.8856 

2.1894 

2.9200 

4.3027 

6.9646 

9.9248 

14. ( 

890 

22.3271 

24.9700 

31.5991 

3 

1.6377 

1.8589 

2.3534 

3.1824 

4.5407 

5.8409 

7.4 

333 

10.2145 

11.0207 

12.9240 

976 

5 

1.4759 

1.6493 

2.0150 

2.5706 

3.3649 

4.0321 

4.7733 

5.8934 

6.1943 

6.8688 

•  Valores  críticos  para  la  distribución  Chi-cuadrado:  se  proporcionan  los  valores  críticos 
Xa  n  •  Los  g.l.  disponibles  son  desde  el  1  hasta  el  45,  indicados  en  la  primera  columna,  y  los 
valores  de  a  son:  0.0025,  0.0050,  0.0100,  0.0250,  0.0500,  0.9500,  0.9750,  0.9900,  0.9950  y 
0.9975,  indicados  en  la  primera  fila.  Por  ejemplo,  si  necesitamos  buscar  el  valor  crítico  de 
Xo .9750,4  con  g-l-=4,  obtendremos  el  valor  0.4844  (como  se  muestra  en  la  siguiente  gráfica  que 
es  un  fragmento  de  la  original). 


Chi-cuadrado 


g-1- 

0.9975 

0.9950 

0.9900 

0.9 

750 

0.9500 

0.0500 

0.0250 

0.0100 

0.0050 

0.0025 

1 

0.0000 

0.0000 

0.0002 

q 

© 

)10 

0.0039 

3.8415 

5.0239 

6.6349 

7.8794 

9.1406 

2 

0.0050 

0.0100 

0.0201 

0.0 

>06 

0.1026 

5.9915 

7.3778 

9.2103 

10.5966 

11.9829 

3 

0.0449 

0.0717 

0.1148 

0.2 

en 

00 

0.3518 

7.8147 

9.3484 

11.3449 

12.8382 

14.3203 

4— 

0.1440 

0.2070 

— 0t207-1— 

-*0.4^ 

844 

0.7107 

9.4877 

11.1433 

13.2767 

14.8603 

16.4239 

5 

0.3075 

0.4117 

0.5543 

0.8312 

1.1455 

11.0705 

12.8325 

15.0863 

16.7496 

18.3856 

6 

0.5266 

0.6757 

0.8721 

1.2373 

1.6354 

12.5916 

14.4494 

16.8119 

18.5476 

20.2494 
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Binomial  con  n  =  5 


k 

0.01 

0.05 

0.10 

0.20 

0.25 

0.30 

0.40 

0.50 

0.60 

0.70 

0.75 

0.80 

0.90 

0.95 

0.99 

0 

0.9510 

0.7738 

0.5905 

0.3277 

0.2373 

0.1681 

0.0778 

0.0313 

0.0102 

0.0024 

0.0010 

0.0003 

0.0000 

0.0000 

0.0000 

1 

0.9990 

0.9774 

0.9185 

0.7373 

0.6328 

0.5282 

0.3370 

0.1875 

0.0870 

0.0308 

0.0156 

0.0067 

0.0005 

0.0000 

0.0000 

2 

1.0000 

0.9988 

0.9914 

0.9421 

0.8965 

0.8369 

0.6826 

0.5000 

0.3174 

0.1631 

0.1035 

0.0579 

0.0086 

0.0012 

0.0000 

3 

1.0000 

1.0000 

0.9995 

0.9933 

0.9844 

0.9692 

0.9130 

0.8125 

0.6630 

0.4718 

0.3672 

0.2627 

0.0815 

0.0226 

0.0010 

4 

1.0000 

1.0000 

1.0000 

0.9997 

0.9990 

0.9976 

0.9898 

0.9688 

0.9222 

0.8319 

0.7627 

0.6723 

0.4095 

0.2262 

0.0490 

Binomial  con  n  =  10 


k 

0.01 

0.05 

0.10 

0.20 

0.25 

0.30 

0.40 

0.50 

0.60 

0.70 

0.75 

0.80 

0.90 

0.95 

0.99 

0 

0.9044 

0.5987 

0.3487 

0.1074 

0.0563 

0.0282 

0.0060 

0.0010 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

1 

0.9957 

0.9139 

0.7361 

0.3758 

0.2440 

0.1493 

0.0464 

0.0107 

0.0017 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

2 

0.9999 

0.9885 

0.9298 

0.6778 

0.5256 

0.3828 

0.1673 

0.0547 

0.0123 

0.0016 

0.0004 

0.0001 

0.0000 

0.0000 

0.0000 

3 

1.0000 

0.9990 

0.9872 

0.8791 

0.7759 

0.6496 

0.3823 

0.1719 

0.0548 

0.0106 

0.0035 

0.0009 

0.0000 

0.0000 

0.0000 

4 

1.0000 

0.9999 

0.9984 

0.9672 

0.9219 

0.8497 

0.6331 

0.3770 

0.1662 

0.0473 

0.0197 

0.0064 

0.0001 

0.0000 

0.0000 

5 

1.0000 

1.0000 

0.9999 

0.9936 

0.9803 

0.9527 

0.8338 

0.6230 

0.3669 

0.1503 

0.0781 

0.0328 

0.0016 

0.0001 

0.0000 

6 

1.0000 

1.0000 

1.0000 

0.9991 

0.9965 

0.9894 

0.9452 

0.8281 

0.6177 

0.3504 

0.2241 

0.1209 

0.0128 

0.0010 

0.0000 

7 

1.0000 

1.0000 

1.0000 

0.9999 

0.9996 

0.9984 

0.9877 

0.9453 

0.8327 

0.6172 

0.4744 

0.3222 

0.0702 

0.0115 

0.0001 

8 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9983 

0.9893 

0.9536 

0.8507 

0.7560 

0.6242 

0.2639 

0.0861 

0.0043 

9 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9990 

0.9940 

0.9718 

0.9437 

0.8926 

0.6513 

0.4013 

0.0956 

Binomial  con  n  =  15 


k 

0.01 

0.05 

0.10 

0.20 

0.25 

0.30 

0.40 

0.50 

0.60 

0.70 

0.75 

0.80 

0.90 

0.95 

0.99 

0 

0.8601 

0.4633 

0.2059 

0.0352 

0.0134 

0.0047 

0.0005 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

1 

0.9904 

0.8290 

0.5490 

0.1671 

0.0802 

0.0353 

0.0052 

0.0005 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

2 

0.9996 

0.9638 

0.8159 

0.3980 

0.2361 

0.1268 

0.0271 

0.0037 

0.0003 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

3 

1.0000 

0.9945 

0.9444 

0.6482 

0.4613 

0.2969 

0.0905 

0.0176 

0.0019 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

4 

1.0000 

0.9994 

0.9873 

0.8358 

0.6865 

0.5155 

0.2173 

0.0592 

0.0093 

0.0007 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

5 

1.0000 

0.9999 

0.9978 

0.9389 

0.8516 

0.7216 

0.4032 

0.1509 

0.0338 

0.0037 

0.0008 

0.0001 

0.0000 

0.0000 

0.0000 

6 

1.0000 

1.0000 

0.9997 

0.9819 

0.9434 

0.8689 

0.6098 

0.3036 

0.0950 

0.0152 

0.0042 

0.0008 

0.0000 

0.0000 

0.0000 

7 

1.0000 

1.0000 

1.0000 

0.9958 

0.9827 

0.9500 

0.7869 

0.5000 

0.2131 

0.0500 

0.0173 

0.0042 

0.0000 

0.0000 

0.0000 

8 

1.0000 

1.0000 

1.0000 

0.9992 

0.9958 

0.9848 

0.9050 

0.6964 

0.3902 

0.1311 

0.0566 

0.0181 

0.0003 

0.0000 

0.0000 

9 

1.0000 

1.0000 

1.0000 

0.9999 

0.9992 

0.9963 

0.9662 

0.8491 

0.5968 

0.2784 

0.1484 

0.0611 

0.0022 

0.0001 

0.0000 

10 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9993 

0.9907 

0.9408 

0.7827 

0.4845 

0.3135 

0.1642 

0.0127 

0.0006 

0.0000 

11 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9981 

0.9824 

0.9095 

0.7031 

0.5387 

0.3518 

0.0556 

0.0055 

0.0000 

12 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9963 

0.9729 

0.8732 

0.7639 

0.6020 

0.1841 

0.0362 

0.0004 

13 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

0.9948 

0.9647 

0.9198 

0.8329 

0.4510 

0.1710 

0.0096 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

0.9953 

0.9866 

0.9648 

0.7941 

0.5367 

0.1399 
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Binomial  con  n  =  20 


k 

0.10 

0.20 

0.25 

0.30 

0.40 

0.50 

0.60 

0.70 

0.75 

0.80 

0.90 

0.95 

0.99 

0 

0.8179 

0.3585 

0.1216 

0.0115 

0.0032 

0.0008 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

1 

0.9831 

0.7358 

0.3917 

0.0692 

0.0243 

0.0076 

0.0005 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

2 

0.9990 

0.9245 

0.6769 

0.2061 

0.0913 

0.0355 

0.0036 

0.0002 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

3 

1.0000 

0.9841 

0.8670 

0.4114 

0.2252 

0.1071 

0.0160 

0.0013 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

4 

1.0000 

0.9974 

0.9568 

0.6296 

0.4148 

0.2375 

0.0510 

0.0059 

0.0003 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

5 

1.0000 

0.9997 

0.9887 

0.8042 

0.6172 

0.4164 

0.1256 

0.0207 

0.0016 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

6 

1.0000 

1.0000 

0.9976 

0.9133 

0.7858 

0.6080 

0.2500 

0.0577 

0.0065 

0.0003 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

7 

1.0000 

1.0000 

0.9996 

0.9679 

0.8982 

0.7723 

0.4159 

0.1316 

0.0210 

0.0013 

0.0002 

0.0000 

0.0000 

0.0000 

0.0000 

8 

1.0000 

1.0000 

0.9999 

0.9900 

0.9591 

0.8867 

0.5956 

0.2517 

0.0565 

0.0051 

0.0009 

0.0001 

0.0000 

0.0000 

0.0000 

9 

1.0000 

1.0000 

1.0000 

0.9974 

0.9861 

0.9520 

0.7553 

0.4119 

0.1275 

0.0171 

0.0039 

0.0006 

0.0000 

0.0000 

0.0000 

10 

1.0000 

1.0000 

1.0000 

0.9994 

0.9961 

0.9829 

0.8725 

0.5881 

0.2447 

0.0480 

0.0139 

0.0026 

0.0000 

0.0000 

0.0000 

11 

1.0000 

1.0000 

1.0000 

0.9999 

0.9991 

0.9949 

0.9435 

0.7483 

0.4044 

0.1133 

0.0409 

0.0100 

0.0001 

0.0000 

0.0000 

12 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9987 

0.9790 

0.8684 

0.5841 

0.2277 

0.1018 

0.0321 

0.0004 

0.0000 

0.0000 

13 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9935 

0.9423 

0.7500 

0.3920 

0.2142 

0.0867 

0.0024 

0.0000 

0.0000 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9984 

0.9793 

0.8744 

0.5836 

0.3828 

0.1958 

0.0113 

0.0003 

0.0000 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9941 

0.9490 

0.7625 

0.5852 

0.3704 

0.0432 

0.0026 

0.0000 

16 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9987 

0.9840 

0.8929 

0.7748 

0.5886 

0.1330 

0.0159 

0.0000 

17 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9964 

0.9645 

0.9087 

0.7939 

0.3231 

0.0755 

0.0010 

18 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

0.9924 

0.9757 

0.9308 

0.6083 

0.2642 

0.0169 

19 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9992 

0.9968 

0.9885 

0.8784 

0.6415 

0.1821 

Binomial  con  n  =  25 


k 

0.10 

0.20 

0.25 

0.30 

0.40 

0.50 

0.60 

0.70 

0.75 

0.80 

0.90 

0.95 

0.99 

0 

0.7778 

0.2774 

0.0718 

0.0038 

0.0008 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

1 

0.9742 

0.6424 

0.2712 

0.0274 

0.0070 

0.0016 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

2 

0.9980 

0.8729 

0.5371 

0.0982 

0.0321 

0.0090 

0.0004 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

3 

0.9999 

0.9659 

0.7636 

0.2340 

0.0962 

0.0332 

0.0024 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

4 

1.0000 

0.9928 

0.9020 

0.4207 

0.2137 

0.0905 

0.0095 

0.0005 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

5 

1.0000 

0.9988 

0.9666 

0.6167 

0.3783 

0.1935 

0.0294 

0.0020 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

6 

1.0000 

0.9998 

0.9905 

0.7800 

0.5611 

0.3407 

0.0736 

0.0073 

0.0003 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

7 

1.0000 

1.0000 

0.9977 

0.8909 

0.7265 

0.5118 

0.1536 

0.0216 

0.0012 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

8 

1.0000 

1.0000 

0.9995 

0.9532 

0.8506 

0.6769 

0.2735 

0.0539 

0.0043 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

9 

1.0000 

1.0000 

0.9999 

0.9827 

0.9287 

0.8106 

0.4246 

0.1148 

0.0132 

0.0005 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

10 

1.0000 

1.0000 

1.0000 

0.9944 

0.9703 

0.9022 

0.5858 

0.2122 

0.0344 

0.0018 

0.0002 

0.0000 

0.0000 

0.0000 

0.0000 

11 

1.0000 

1.0000 

1.0000 

0.9985 

0.9893 

0.9558 

0.7323 

0.3450 

0.0778 

0.0060 

0.0009 

0.0001 

0.0000 

0.0000 

0.0000 

12 

1.0000 

1.0000 

1.0000 

0.9996 

0.9966 

0.9825 

0.8462 

0.5000 

0.1538 

0.0175 

0.0034 

0.0004 

0.0000 

0.0000 

0.0000 

13 

1.0000 

1.0000 

1.0000 

0.9999 

0.9991 

0.9940 

0.9222 

0.6550 

0.2677 

0.0442 

0.0107 

0.0015 

0.0000 

0.0000 

0.0000 

14 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9982 

0.9656 

0.7878 

0.4142 

0.0978 

0.0297 

0.0056 

0.0000 

0.0000 

0.0000 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

0.9868 

0.8852 

0.5754 

0.1894 

0.0713 

0.0173 

0.0001 

0.0000 

0.0000 

16 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9957 

0.9461 

0.7265 

0.3231 

0.1494 

0.0468 

0.0005 

0.0000 

0.0000 

17 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9988 

0.9784 

0.8464 

0.4882 

0.2735 

0.1091 

0.0023 

0.0000 

0.0000 

18 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9927 

0.9264 

0.6593 

0.4389 

0.2200 

0.0095 

0.0002 

0.0000 

19 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9980 

0.9706 

0.8065 

0.6217 

0.3833 

0.0334 

0.0012 

0.0000 

20 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

0.9905 

0.9095 

0.7863 

0.5793 

0.0980 

0.0072 

0.0000 

21 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9976 

0.9668 

0.9038 

0.7660 

0.2364 

0.0341 

0.0001 

22 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9996 

0.9910 

0.9679 

0.9018 

0.4629 

0.1271 

0.0020 

23 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9984 

0.9930 

0.9726 

0.7288 

0.3576 

0.0258 

24 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9992 

0.9962 

0.9282 

0.7226 

0.2222 

176 


Poisson 


k 

0.1 

0.2 

0.3 

0.4 

0.5 

0.6 

0 

0.9048 

0.8187 

0.7408 

0.6703 

0.6065 

0.5488 

1 

0.9953 

0.9825 

0.9631 

0.9384 

0.9098 

0.8781 

2 

0.9998 

0.9989 

0.9964 

0.9921 

0.9856 

0.9769 

3 

1.0000 

0.9999 

0.9997 

0.9992 

0.9982 

0.9966 

4 

1.0000 

1.0000 

0.9999 

0.9998 

0.9996 

5 

1.0000 

1.0000 

1.0000 

6 

7 

8 

9 

10 
11 
12 

13 

14 

15 

16 

17 

18 

19 

20 
21 
22 

23 

24 

25 

26 

27 

28 

29 

30 

31 

32 


0.7 

0.8 

0.9 

1 

2 

3 

0.4966 

0.4493 

0.4066 

0.3679 

0.1353 

0.0498 

0.8442 

0.8088 

0.7725 

0.7358 

0.4060 

0.1991 

0.9659 

0.9526 

0.9371 

0.9197 

0.6767 

0.4232 

0.9942 

0.9909 

0.9865 

0.9810 

0.8571 

0.6472 

0.9992 

0.9986 

0.9977 

0.9963 

0.9473 

0.8153 

0.9999 

0.9998 

0.9997 

0.9994 

0.9834 

0.9161 

1.0000 

1.0000 

1.0000 

0.9999 

0.9955 

0.9665 

1.0000 

0.9989 

0.9881 

0.9998  0.9962 

1.0000  0.9989 

0.9997 
0.9999 
1.0000 


4 

5 

6 

7 

8 

9 

10 

12 

15 

17 

20 

25 

0.0183 

0.0067 

0.0025 

0.0009 

0.0003 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0916 

0.0404 

0.0174 

0.0073 

0.0030 

0.0012 

0.0005 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.2381 

0.1247 

0.0620 

0.0296 

0.0138 

0.0062 

0.0028 

0.0005 

0.0000 

0.0000 

0.0000 

0.0000 

0.4335 

0.2650 

0.1512 

0.0818 

0.0424 

0.0212 

0.0103 

0.0023 

0.0002 

0.0000 

0.0000 

0.0000 

0.6288 

0.4405 

0.2851 

0.1730 

0.0996 

0.0550 

0.0293 

0.0076 

0.0009 

0.0002 

0.0000 

0.0000 

0.7851 

0.6160 

0.4457 

0.3007 

0.1912 

0.1157 

0.0671 

0.0203 

0.0028 

0.0007 

0.0001 

0.0000 

0.8893 

0.7622 

0.6063 

0.4497 

0.3134 

0.2068 

0.1301 

0.0458 

0.0076 

0.0021 

0.0003 

0.0000 

0.9489 

0.8666 

0.7440 

0.5987 

0.4530 

0.3239 

0.2202 

0.0895 

0.0180 

0.0054 

0.0008 

0.0000 

0.9786 

0.9319 

0.8472 

0.7291 

0.5925 

0.4557 

0.3328 

0.1550 

0.0374 

0.0126 

0.0021 

0.0001 

0.9919 

0.9682 

0.9161 

0.8305 

0.7166 

0.5874 

0.4579 

0.2424 

0.0699 

0.0261 

0.0050 

0.0002 

0.9972 

0.9863 

0.9574 

0.9015 

0.8159 

0.7060 

0.5830 

0.3472 

0.1185 

0.0491 

0.0108 

0.0006 

0.9991 

0.9945 

0.9799 

0.9467 

0.8881 

0.8030 

0.6968 

0.4616 

0.1848 

0.0847 

0.0214 

0.0014 

0.9997 

0.9980 

0.9912 

0.9730 

0.9362 

0.8758 

0.7916 

0.5760 

0.2676 

0.1350 

0.0390 

0.0031 

0.9999 

0.9993 

0.9964 

0.9872 

0.9658 

0.9261 

0.8645 

0.6815 

0.3632 

0.2009 

0.0661 

0.0065 

1.0000 

0.9998 

0.9986 

0.9943 

0.9827 

0.9585 

0.9165 

0.7720 

0.4657 

0.2808 

0.1049 

0.0124 

0.9999 

0.9995 

0.9976 

0.9918 

0.9780 

0.9513 

0.8444 

0.5681 

0.3715 

0.1565 

0.0223 

1.0000 

0.9998 

0.9990 

0.9963 

0.9889 

0.9730 

0.8987 

0.6641 

0.4677 

0.2211 

0.0377 

0.9999 

0.9996 

0.9984 

0.9947 

0.9857 

0.9370 

0.7489 

0.5640 

0.2970 

0.0605 

1.0000 

0.9999 

0.9993 

0.9976 

0.9928 

0.9626 

0.8195 

0.6550 

0.3814 

0.0920 

1.0000 

0.9997 

0.9989 

0.9965 

0.9787 

0.8752 

0.7363 

0.4703 

0.1336 

0.9999 

0.9996 

0.9984 

0.9884 

0.9170 

0.8055 

0.5591 

0.1855 

1.0000 

0.9998 

0.9993 

0.9939 

0.9469 

0.8615 

0.6437 

0.2473 

0.9999 

0.9997 

0.9970 

0.9673 

0.9047 

0.7206 

0.3175 

1.0000 

0.9999 

0.9985 

0.9805 

0.9367 

0.7875 

0.3939 

1.0000 

0.9993 

0.9888 

0.9594 

0.8432 

0.4734 

0.9997 

0.9938 

0.9748 

0.8878 

0.5529 

0.9999 

0.9967 

0.9848 

0.9221 

0.6294 

0.9999 

0.9983 

0.9912 

0.9475 

0.7002 

1.0000 

0.9991 

0.9950 

0.9657 

0.7634 

0.9996 

0.9973 

0.9782 

0.8179 

0.9998 

0.9986 

0.9865 

0.8633 

0.9999 

0.9993 

0.9919 

0.8999 

1.0000 

0.9996 

0.9953 

0.9285 
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Normal  estándar 


z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

-3.5 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

-3.4 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0002 

-3.3 

0.0005 

0.0005 

0.0005 

0.0004 

0.0004 

0.0004 

0.0004 

0.0004 

0.0004 

0.0003 

-3.2 

0.0007 

0.0007 

0.0006 

0.0006 

0.0006 

0.0006 

0.0006 

0.0005 

0.0005 

0.0005 

-3.1 

0.0010 

0.0009 

0.0009 

0.0009 

0.0008 

0.0008 

0.0008 

0.0008 

0.0007 

0.0007 

-3.0 

0.0013 

0.0013 

0.0013 

0.0012 

0.0012 

0.0011 

0.0011 

0.0011 

0.0010 

0.0010 

-2.9 

0.0019 

0.0018 

0.0018 

0.0017 

0.0016 

0.0016 

0.0015 

0.0015 

0.0014 

0.0014 

-2.8 

0.0026 

0.0025 

0.0024 

0.0023 

0.0023 

0.0022 

0.0021 

0.0021 

0.0020 

0.0019 

-2.7 

0.0035 

0.0034 

0.0033 

0.0032 

0.0031 

0.0030 

0.0029 

0.0028 

0.0027 

0.0026 

-2.6 

0.0047 

0.0045 

0.0044 

0.0043 

0.0041 

0.0040 

0.0039 

0.0038 

0.0037 

0.0036 

-2.5 

0.0062 

0.0060 

0.0059 

0.0057 

0.0055 

0.0054 

0.0052 

0.0051 

0.0049 

0.0048 

-2.4 

0.0082 

0.0080 

0.0078 

0.0075 

0.0073 

0.0071 

0.0069 

0.0068 

0.0066 

0.0064 

-2.3 

0.0107 

0.0104 

0.0102 

0.0099 

0.0096 

0.0094 

0.0091 

0.0089 

0.0087 

0.0084 

-2.2 

0.0139 

0.0136 

0.0132 

0.0129 

0.0125 

0.0122 

0.0119 

0.0116 

0.0113 

0.0110 

-2.1 

0.0179 

0.0174 

0.0170 

0.0166 

0.0162 

0.0158 

0.0154 

0.0150 

0.0146 

0.0143 

-2.0 

0.0228 

0.0222 

0.0217 

0.0212 

0.0207 

0.0202 

0.0197 

0.0192 

0.0188 

0.0183 

-1.9 

0.0287 

0.0281 

0.0274 

0.0268 

0.0262 

0.0256 

0.0250 

0.0244 

0.0239 

0.0233 

-1.8 

0.0359 

0.0351 

0.0344 

0.0336 

0.0329 

0.0322 

0.0314 

0.0307 

0.0301 

0.0294 

-1.7 

0.0446 

0.0436 

0.0427 

0.0418 

0.0409 

0.0401 

0.0392 

0.0384 

0.0375 

0.0367 

-1.6 

0.0548 

0.0537 

0.0526 

0.0516 

0.0505 

0.0495 

0.0485 

0.0475 

0.0465 

0.0455 

-1.5 

0.0668 

0.0655 

0.0643 

0.0630 

0.0618 

0.0606 

0.0594 

0.0582 

0.0571 

0.0559 

-1.4 

0.0808 

0.0793 

0.0778 

0.0764 

0.0749 

0.0735 

0.0721 

0.0708 

0.0694 

0.0681 

-1.3 

0.0968 

0.0951 

0.0934 

0.0918 

0.0901 

0.0885 

0.0869 

0.0853 

0.0838 

0.0823 

-1.2 

0.1151 

0.1131 

0.1112 

0.1093 

0.1075 

0.1056 

0.1038 

0.1020 

0.1003 

0.0985 

-1.1 

0.1357 

0.1335 

0.1314 

0.1292 

0.1271 

0.1251 

0.1230 

0.1210 

0.1190 

0.1170 

-1.0 

0.1587 

0.1562 

0.1539 

0.1515 

0.1492 

0.1469 

0.1446 

0.1423 

0.1401 

0.1379 

-0.9 

0.1841 

0.1814 

0.1788 

0.1762 

0.1736 

0.1711 

0.1685 

0.1660 

0.1635 

0.1611 

-0.8 

0.2119 

0.2090 

0.2061 

0.2033 

0.2005 

0.1977 

0.1949 

0.1922 

0.1894 

0.1867 

-0.7 

0.2420 

0.2389 

0.2358 

0.2327 

0.2296 

0.2266 

0.2236 

0.2206 

0.2177 

0.2148 

-0.6 

0.2743 

0.2709 

0.2676 

0.2643 

0.2611 

0.2578 

0.2546 

0.2514 

0.2483 

0.2451 

-0.5 

0.3085 

0.3050 

0.3015 

0.2981 

0.2946 

0.2912 

0.2877 

0.2843 

0.2810 

0.2776 

-0.4 

0.3446 

0.3409 

0.3372 

0.3336 

0.3300 

0.3264 

0.3228 

0.3192 

0.3156 

0.3121 

-0.3 

0.3821 

0.3783 

0.3745 

0.3707 

0.3669 

0.3632 

0.3594 

0.3557 

0.3520 

0.3483 

-0.2 

0.4207 

0.4168 

0.4129 

0.4090 

0.4052 

0.4013 

0.3974 

0.3936 

0.3897 

0.3859 

-0.1 

0.4602 

0.4562 

0.4522 

0.4483 

0.4443 

0.4404 

0.4364 

0.4325 

0.4286 

0.4247 

0.0 


0.500  0.4960  0.4920  0.4880  0.4840  0.4801  0.4761  0.4721  0.4681  0.4641 


Normal  estándar 


z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

0.0 

0.5000 

0.5040 

0.5080 

0.5120 

0.5160 

0.5199 

0.5239 

0.5279 

0.5319 

0.5359 

0.1 

0.5398 

0.5438 

0.5478 

0.5517 

0.5557 

0.5596 

0.5636 

0.5675 

0.5714 

0.5753 

0.2 

0.5793 

0.5832 

0.5871 

0.5910 

0.5948 

0.5987 

0.6026 

0.6064 

0.6103 

0.6141 

0.3 

0.6179 

0.6217 

0.6255 

0.6293 

0.6331 

0.6368 

0.6406 

0.6443 

0.6480 

0.6517 

0.4 

0.6554 

0.6591 

0.6628 

0.6664 

0.6700 

0.6736 

0.6772 

0.6808 

0.6844 

0.6879 

0.5 

0.6915 

0.6950 

0.6985 

0.7019 

0.7054 

0.7088 

0.7123 

0.7157 

0.7190 

0.7224 

0.6 

0.7257 

0.7291 

0.7324 

0.7357 

0.7389 

0.7422 

0.7454 

0.7486 

0.7517 

0.7549 

0.7 

0.7580 

0.7611 

0.7642 

0.7673 

0.7704 

0.7734 

0.7764 

0.7794 

0.7823 

0.7852 

0.8 

0.7881 

0.7910 

0.7939 

0.7967 

0.7995 

0.8023 

0.8051 

0.8078 

0.8106 

0.8133 

0.9 

0.8159 

0.8186 

0.8212 

0.8238 

0.8264 

0.8289 

0.8315 

0.8340 

0.8365 

0.8389 

1.0 

0.8413 

0.8438 

0.8461 

0.8485 

0.8508 

0.8531 

0.8554 

0.8577 

0.8599 

0.8621 

1.1 

0.8643 

0.8665 

0.8686 

0.8708 

0.8729 

0.8749 

0.8770 

0.8790 

0.8810 

0.8830 

1.2 

0.8849 

0.8869 

0.8888 

0.8907 

0.8925 

0.8944 

0.8962 

0.8980 

0.8997 

0.9015 

1.3 

0.9032 

0.9049 

0.9066 

0.9082 

0.9099 

0.9115 

0.9131 

0.9147 

0.9162 

0.9177 

1.4 

0.9192 

0.9207 

0.9222 

0.9236 

0.9251 

0.9265 

0.9279 

0.9292 

0.9306 

0.9319 

1.5 

0.9332 

0.9345 

0.9357 

0.9370 

0.9382 

0.9394 

0.9406 

0.9418 

0.9429 

0.9441 

1.6 

0.9452 

0.9463 

0.9474 

0.9484 

0.9495 

0.9505 

0.9515 

0.9525 

0.9535 

0.9545 

1.7 

0.9554 

0.9564 

0.9573 

0.9582 

0.9591 

0.9599 

0.9608 

0.9616 

0.9625 

0.9633 

1.8 

0.9641 

0.9649 

0.9656 

0.9664 

0.9671 

0.9678 

0.9686 

0.9693 

0.9699 

0.9706 

1.9 

0.9713 

0.9719 

0.9726 

0.9732 

0.9738 

0.9744 

0.9750 

0.9756 

0.9761 

0.9767 

2.0 

0.9772 

0.9778 

0.9783 

0.9788 

0.9793 

0.9798 

0.9803 

0.9808 

0.9812 

0.9817 

2.1 

0.9821 

0.9826 

0.9830 

0.9834 

0.9838 

0.9842 

0.9846 

0.9850 

0.9854 

0.9857 

2.2 

0.9861 

0.9864 

0.9868 

0.9871 

0.9875 

0.9878 

0.9881 

0.9884 

0.9887 

0.9890 

2.3 

0.9893 

0.9896 

0.9898 

0.9901 

0.9904 

0.9906 

0.9909 

0.9911 

0.9913 

0.9916 

2.4 

0.9918 

0.9920 

0.9922 

0.9925 

0.9927 

0.9929 

0.9931 

0.9932 

0.9934 

0.9936 

2.5 

0.9938 

0.9940 

0.9941 

0.9943 

0.9945 

0.9946 

0.9948 

0.9949 

0.9951 

0.9952 

2.6 

0.9953 

0.9955 

0.9956 

0.9957 

0.9959 

0.9960 

0.9961 

0.9962 

0.9963 

0.9964 

2.7 

0.9965 

0.9966 

0.9967 

0.9968 

0.9969 

0.9970 

0.9971 

0.9972 

0.9973 

0.9974 

2.8 

0.9974 

0.9975 

0.9976 

0.9977 

0.9977 

0.9978 

0.9979 

0.9979 

0.9980 

0.9981 

2.9 

0.9981 

0.9982 

0.9982 

0.9983 

0.9984 

0.9984 

0.9985 

0.9985 

0.9986 

0.9986 

3.0 

0.9987 

0.9987 

0.9987 

0.9988 

0.9988 

0.9989 

0.9989 

0.9989 

0.9990 

0.9990 

3.1 

0.9990 

0.9991 

0.9991 

0.9991 

0.9992 

0.9992 

0.9992 

0.9992 

0.9993 

0.9993 

3.2 

0.9993 

0.9993 

0.9994 

0.9994 

0.9994 

0.9994 

0.9994 

0.9995 

0.9995 

0.9995 

3.3 

0.9995 

0.9995 

0.9995 

0.9996 

0.9996 

0.9996 

0.9996 

0.9996 

0.9996 

0.9997 

3.4 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9998 

3.5 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 
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Chi-cuadrado 


g.l. 

0.9975 

0.9950 

0.9900 

0.9750 

0.9500 

0.0500 

0.0250 

0.0100 

0.0050 

0.0025 

1 

0.0000 

0.0000 

0.0002 

0.0010 

0.0039 

3.8415 

5.0239 

6.6349 

7.8794 

9.1406 

2 

0.0050 

0.0100 

0.0201 

0.0506 

0.1026 

5.9915 

7.3778 

9.2103 

10.5966 

11.9829 

3 

0.0449 

0.0717 

0.1148 

0.2158 

0.3518 

7.8147 

9.3484 

11.3449 

12.8382 

14.3203 

4 

0.1449 

0.2070 

0.2971 

0.4844 

0.7107 

9.4877 

11.1433 

13.2767 

14.8603 

16.4239 

5 

0.3075 

0.4117 

0.5543 

0.8312 

1.1455 

11.0705 

12.8325 

15.0863 

16.7496 

18.3856 

6 

0.5266 

0.6757 

0.8721 

1.2373 

1.6354 

12.5916 

14.4494 

16.8119 

18.5476 

20.2494 

7 

0.7945 

0.9893 

1.2390 

1.6899 

2.1673 

14.0671 

16.0128 

18.4753 

20.2777 

22.0404 

8 

1.1043 

1.3444 

1.6465 

2.1797 

2.7326 

15.5073 

17.5345 

20.0902 

21.9550 

23.7745 

9 

1.4501 

1.7349 

2.0879 

2.7004 

3.3251 

16.9190 

19.0228 

21.6660 

23.5894 

25.4625 

10 

1.8274 

2.1559 

2.5582 

3.2470 

3.9403 

18.3070 

20.4832 

23.2093 

25.1882 

27.1122 

11 

2.2321 

2.6032 

3.0535 

3.8157 

4.5748 

19.6751 

21.9200 

24.7250 

26.7568 

28.7293 

12 

2.6612 

3.0738 

3.5706 

4.4038 

5.2260 

21.0261 

23.3367 

26.2170 

28.2995 

30.3185 

13 

3.1119 

3.5650 

4.1069 

5.0088 

5.8919 

22.3620 

24.7356 

27.6882 

29.8195 

31.8831 

14 

3.5820 

4.0747 

4.6604 

5.6287 

6.5706 

23.6848 

26.1189 

29.1412 

31.3193 

33.4260 

15 

4.0697 

4.6009 

5.2293 

6.2621 

7.2609 

24.9958 

27.4884 

30.5779 

32.8013 

34.9496 

16 

4.5734 

5.1422 

5.8122 

6.9077 

7.9616 

26.2962 

28.8454 

31.9999 

34.2672 

36.4557 

17 

5.0917 

5.6972 

6.4078 

7.5642 

8.6718 

27.5871 

30.1910 

33.4087 

35.7185 

37.9461 

18 

5.6233 

6.2648 

7.0149 

8.2307 

9.3905 

28.8693 

31.5264 

34.8053 

37.1565 

39.4221 

19 

6.1674 

6.8440 

7.6327 

8.9065 

10.1170 

30.1435 

32.8523 

36.1909 

38.5823 

40.8850 

20 

6.7228 

7.4338 

8.2604 

9.5908 

10.8508 

31.4104 

34.1696 

37.5662 

39.9968 

42.3357 

21 

7.2889 

8.0337 

8.8972 

10.2829 

11.5913 

32.6706 

35.4789 

38.9322 

41.4011 

43.7751 

22 

7.8649 

8.6427 

9.5425 

10.9823 

12.3380 

33.9244 

36.7807 

40.2894 

42.7957 

45.2041 

23 

8.4502 

9.2604 

10.1957 

11.6886 

13.0905 

35.1725 

38.0756 

41.6384 

44.1813 

46.6235 

24 

9.0442 

9.8862 

10.8564 

12.4012 

13.8484 

36.4150 

39.3641 

42.9798 

45.5585 

48.0337 

25 

9.6463 

10.5197 

11.5240 

13.1197 

14.6114 

37.6525 

40.6465 

44.3141 

46.9279 

49.4354 

26 

10.2562 

11.1602 

12.1981 

13.8439 

15.3792 

38.8851 

41.9232 

45.6417 

48.2899 

50.8291 

27 

10.8733 

11.8076 

12.8785 

14.5734 

16.1514 

40.1133 

43.1945 

46.9629 

49.6449 

52.2153 

28 

11.4973 

12.4613 

13.5647 

15.3079 

16.9279 

41.3371 

44.4608 

48.2782 

50.9934 

53.5943 

29 

12.1279 

13.1211 

14.2565 

16.0471 

17.7084 

42.5570 

45.7223 

49.5879 

52.3356 

54.9666 

30 

12.7646 

13.7867 

14.9535 

16.7908 

18.4927 

43.7730 

46.9792 

50.8922 

53.6720 

56.3325 

31 

13.4073 

14.4578 

15.6555 

17.5387 

19.2806 

44.9853 

48.2319 

52.1914 

55.0027 

57.6923 

32 

14.0555 

15.1340 

16.3622 

18.2908 

20.0719 

46.1943 

49.4804 

53.4858 

56.3281 

59.0464 

33 

14.7092 

15.8153 

17.0735 

19.0467 

20.8665 

47.3999 

50.7251 

54.7755 

57.6484 

60.3949 

34 

15.3680 

16.5013 

17.7891 

19.8063 

21.6643 

48.6024 

51.9660 

56.0609 

58.9639 

61.7381 

35 

16.0317 

17.1918 

18.5089 

20.5694 

22.4650 

49.8018 

53.2033 

57.3421 

60.2748 

63.0764 

36 

16.7001 

17.8867 

19.2327 

21.3359 

23.2686 

50.9985 

54.4373 

58.6192 

61.5812 

64.4098 

37 

17.3730 

18.5858 

19.9602 

22.1056 

24.0749 

52.1923 

55.6680 

59.8925 

62.8833 

65.7386 

38 

18.0502 

19.2889 

20.6914 

22.8785 

24.8839 

53.3835 

56.8955 

61.1621 

64.1814 

67.0630 

39 

18.7317 

19.9959 

21.4262 

23.6543 

25.6954 

54.5722 

58.1201 

62.4281 

65.4756 

68.3831 

40 

19.4171 

20.7065 

22.1643 

24.4330 

26.5093 

55.7585 

59.3417 

63.6907 

66.7660 

69.6991 

41 

20.1064 

21.4208 

22.9056 

25.2145 

27.3256 

56.9424 

60.5606 

64.9501 

68.0527 

71.0112 

42 

20.7994 

22.1385 

23.6501 

25.9987 

28.1440 

58.1240 

61.7768 

66.2062 

69.3360 

72.3195 

43 

21.4960 

22.8595 

24.3976 

26.7854 

28.9647 

59.3035 

62.9904 

67.4593 

70.6159 

73.6241 

44 

22.1961 

23.5837 

25.1480 

27.5746 

29.7875 

60.4809 

64.2015 

68.7095 

71.8926 

74.9253 

45 

22.8996 

24.3110 

25.9013 

28.3662 

30.6123 

61.6562 

65.4102 

69.9568 

73.1661 

76.2229 
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APÉNDICE  C 
Resoluciones 


En  este  Apéndice  desarrollaremos  algunos  de  los  ejercicios  propuestos  en  este  libro  en  forma 
detallada. 


EJERCICIO  ED6 

Sabemos  que  al  ser  A  y  Ac  disjuntos,  es  decir,  A  (~l  Ac  =  0,  por  la  Ley  aditiva  tenemos  que: 


P(A  U  AC\B )  =  P(A\B)  +  P(AC\B) 


(C.l) 


Por  otro  lado,  sabemos  que  A  U  Ac  =  ü  entonces 


P(AU  AC\B)  =  P(ü\B)  =  1 


(C.2) 


Entonces  juntando  los  resultados  de  (IC.ll)  y  (IC.2I).  es  verdadera  la  afirmación: 


P(A\B)  +P(AC\B )  =  1 


Por  la  definición  de  probabilidad  condicional,  si  P(A)  >  0,  tenemos  que 

p(A\¿)  =  Fp(^)A)  (C.3) 

Y  como  A  fl  A  =  A  entonces  de  (1C.3I1  obtenemos  que  P(A\Á)  =  P(A) / P(A)  =  1.  Con  lo 
cual,  PÍyA\Á)  =  P{A)  es  falso,  pues  no  vale  para  todo  evento  A. 
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EJERCICIO  04 


Un  “ensayo”  es  extraer  una  bola  y  se  define  como  “éxito”  que  la  bola  extraída  sea  blanca  y 
como  “fracaso”  que  la  bola  extraída  sea  negra.  Si  las  extracciones  se  realizan  con  reemplazo, 
es  decir  devolviendo  a  la  urna  la  bola  extraída,  se  verifica  que  hay  independencia  entre  las 
extracciones.  Luego  la  probabilidad  de  “éxito”  (o  sea  que  la  bola  extraída  es  blanca)  en 
cada  extracción  es  constante  y  vale  1/10  =  0.1.  Entonces  X  =  “el  número  de  bolas  blancas 
obtenidas  en  las  5  extracciones”  es  una  v.a.  binomial,  X  ~  11(5,0.1)  y  Vx  =  {0, 1,2, 3, 4,  5}. 

2.  Observar  que  el  evento  “sacar  exactamente  2  bolas  blancas”  es  el  evento  (X  =  2),  entoces  su 
probabilidad  es: 

P{X  =  2)  =  /( 2)  =  (j^0.12(l  -  O.l)5"2  =  0.0729. 

3.  El  evento  “obtener  al  menos  2  bolas  blancas”  es  el  evento  (X  >  2),  entoces  su  probabilidad 
es: 

P(X  >  2)  =  /( 2)  +  /( 3)  +  /( 4)  +  /( 5)  =  1  -  [/(0)  +  /( 1)]  =  1  -  /(0)  -  /( 1) 

=  1  -  Qo.l°(l  -  O.l)5"0  -  Qo.l4(l  -  O.l)5"1  =  0.0815. 

Notar  que  el  evento  (X  <  3),  representa  al  evento  “sacar  no  más  de  3  bolas  blancas” ,  entonces 
la  probabilidad  pedida  es: 

P(X  <  3)  =  F(3)  =  0.9995  (por  Tabla) 

También  está  probabilidad  se  puede  calcular  como: 

P(X  <  3)  =  1  -  P(X  >  3)  =  1  -  P(X  >  4)  =  1  -  [/(4)  +  / (5)] 

=  1  -  Qo.14(1  -  0.1)5"4  -  Qo.ls(l  -  O.l)5"5  =  0.9995 

EJERCICIO  [216 

Primero  defininimos  la  v.a.  correspondiente  para  poder  resolver  este  ejercicio:  Xt  =  “número 
de  partículas  radiactivas  emitidas  en  t  minutos”,  entonces  Xt  ~  P(At),  con  At  =  6  x  t  =  6t,  es 
decir,  Xt  ~  P(6t). 

Para  resolver  este  inciso  es  claro  que  t  =  1,  es  decir,  necesitamos  la  v.a.  Á'i  =  “número  de 
partículas  radiactivas  emitidas  en  un  minuto”  y  X\  ~  P( 6).  Luego  la  probabilidad  pedida 
es: 

fi° 

P(Xx  =  0)  =  /(0)  =  e"6  —  =  e"6  =  0.0025 


183 


2  Sabemos  que  30  segundos  es  igual  a  medio  minuto,  es  decir  que  t  =  1/2,  entonces  la  v.a.  que 
necesitamos  aquí  es:  X1/2  =  “número  de  partículas  radiactivas  emitidas  en  medio  minuto”  y 
X1/2  ~  P( 3).  Luego  la  probabilidad  pedida  se  calcula  como: 


P(X i/2  >  2)  =  1  -  P(X1/2  <  2)  =  1  -  [P(X1/2  =  0)  +  P( X1/2  =  1)] 


=  1-  [/(0)  +  /(!)]  =  1- 


3°  -o  - 

Ó!  +e  lí 


=  1  -  4  e"3  =  0.8009 


3.  Aquí  necesitamos  definir  dos  v.a.:  X2  =  “número  de  partículas  radiactivas  emitidas  entre  las 
9:10  y  las  9:12  AM”  e  Y2  =  “número  de  partículas  radiactivas  emitidas  entre  las  10:10  y  las 
10:12  AM”.  Sabemos  que  X2  ~  P(12)  (pues  t  =  2)  e  Y2  ~  P(12)  (también  tenemos  t  =  2). 
Entonces  la  probabilidad  pedida  es: 

P[(Y2  =  1)  n  (X2  =  0)] 


p(y2  =  1\X2  =  0)  = 


P(X2  =  0) 


(por  falta  de  memoria) 


.  pjk = .  p{Y2 = t) 

Ppc^ffí 


121 

TT 


=  12  e"12  =  0.0000737 


En  este  inciso  debemos  hallar  el  valor  de  t  para  el  cual  P(Xt  >  1)  >  0.95,  donde  Xt  es  la 
v.a.  definida  al  principio  de  este  ejercicio.  Luego,  si  desarrollamos  la  probabilidad  planteada 
en  la  desigualdad  anterior,  tenemos  que: 

~6t  m° 


P{Xt  >  1)  =  1  -  P(xt  <  1)  =  1  -  P(Xt  =  0)  =  1  -  /(0)  =  1  - 


0! 


=  1  —  e 


-6 1 


Entonces,  ahora  resolvamos  la  desigualdad  planteada  arriba: 


1  -  e~6t  >  0.95 
0.05  -  e_6í  >  0 

0.05  >  e"6t 

ln(0.05)  >  -6 1 

ln(0.05)  ^ 

—6 

0.4993  <  t 


(restando  de  ambos  lados  0.95) 
(sumando  de  ambos  lados  e-6t) 
(aplicando  ln  y  por  propiedad  de  función  inversa) 
(dividiendo  en  ambos  lados  por  —  6) 


Por  lo  tanto,  el  período  de  tiempo  debe  ser  mayor  a  30  segundos  para  que  la  probabilidad  de 
que  haya  al  menos  una  emisión  sea  mayor  a  0.95. 


EJERCICIO  [313 


1.  Sabemos  que  E(X)  =  /l¿,  var(X)  =  a2  y  Z  =  — — — .  Entonces,  por  un  lado: 

C 7 

E(Z)  =  E  ( - —  )  =  E  ( — X  —  —  J  (por  la  Propiedad  de  Linealidad  de  la  esperanza) 

\  a  )  \a  a) 


=  1-E(X)->í  =  %-?  =  0 
o  a  /j  /o 
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Y  por  otro  lado: 


var(Z) 


=  var 


^  — ^  var(X) 


(por  dSTTüt) 


EJERCICIO  ffl2 

Definimos  las  v.a.  X  e  Y  como  las  medidas  del  diámetro  de  la  base  y  altura  (en  metros)  del 
tanque  cilindrico,  respectivamente.  Sabemos  que  =  4.50,  ox  =  0.10,  [iy  =  1.80  y  cry  =  0.06. 
Luego  el  volumen  del  tanque  cilindrico,  a  partir  de  estas  dos  v.a.,  es  la  función: 

V  =  h(X,  Y)  =  tt/2x  X2  x  Y 

Para  calcular  la  desviación  típica  de  V ,  por  la  Proposición  |4]3  (al  ser  h  un  polinomio,  es 
diferenciable  en  (p-x >  Py))-  tenemos  que: 

dh  dh 

—  (X,Y)  =  tt/2  x  2X  x  Y  =  tt  x  X  x  Y  =>  —  (px, pY)  =  tt  x  4.50  x  1.80  =  25.4469 

OsV  O  si. 

f)h  dh 

—  (X,Y)  =  n/2xX2  =►  tt/2  x  4.502  =  31.8086 

Entonces: 

dt{V)  =  Vi25-4469)20-102  +  (31.8086)20.062  =  V6.4754  +  3.6424  =  3.1808 
es  decir,  la  desviación  aproximada  del  volumen  del  tanque  cilindrico  es  de  3.1808  m. 


EJERCICIO  [5U 

2.  Sea  X  el  tiempo  de  vida  (en  horas)  de  una  lámpara,  X  ~  Exp{ A),  entonces  por  la 
Proposición  [3j3,  E(X)  =  1/A.  Por  un  lado,  como  la  función  h( A)  =  1/A  es  continua  pa¬ 
ra  A  >  0  tenemos  que: 

h{ A)  =  h(  A)  =  1/A  (C.4) 

Por  otro  lado,  como  mencionamos  en  el  Capítulo  5,  el  estimador  usual  para  la  media  (o 
esperanza),  es  la  media  muestral  X,  es  decir 

E(X)  =  X  (C.5) 

Entonces  igualando  4Ü2D  y  m  obtenemos  que  el  estimador  para  el  parámetro  A  es: 

A  =  Í/X  (C.6) 
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Ahora  veamos  cual  es  su  estimación:  se  los  datos  tenemos  que  x  =  22.79  entonces,  reempla¬ 
zando  este  valor  en  (IC.6|).  finalmente  obtenemos  A  =  0.0439. 

Para  obtener  ahora  la  estimación  de  la  probabilidad  pedida,  primero  planteamos  esta  proba¬ 
bilidad  que  deseamos  estimar: 

P(X  >  50)  =  1  -  P(X  <  50)  =  1  -  F(50)  =  1  -  (1  -  e_A5°)  =  e“A5° 

Como  vemos  que  esta  probabilidad  es  una  función  continua  del  parámetro,  tenemos  que 
P(xlT{ 50)  =  e"A50  =  e-0  0439x50  =  0.1114 
es  la  probabilidad  estimada  de  que  una  lámpara  de  ese  tipo  dure  más  de  50  horas. 


EJERCICIO  02 

1.  En  el  Ejemplo  5.6,  se  demostró  que  dada  una  m.a.  com  media  /i  y  varianza  ct2,  la  varianza 
muestral,  S 2,  es  un  estimador  insesgado  de  a2,  es  decir,  E(S2)  =  a2.  Entonces,  tenemos  que, 
si  Sf  y  S2  son  las  varianzas  muéstrales  de  Xi,  X2,  ■  .  . ,  Xni  y  Y),  Y2) . . . ,  Yn2  respectivamente, 
luego: 

E(S¡)  =  a2  =  E(S2)  (C.7) 


pues  ambas  m.a.  tienen  la  misma  varianza.  Ahora,  calculemos  la  esperanza  de  S2: 


E{Sl )  =  E 


(ni  -  1 )  ¿>1  +  (n2  -  1)  Si 
ni  +  n2  —  2 


(m  -  1)  E(S¡)  +  (n2  -  1)  E(S2) 
ni  +  ri2  —  2 

(ni  —  1)  a2  +  (n2  —  1)  <J2 
ni  +  n2  —  2 


a2  (n^J^RTr^XP) 


(por  la  Propiedad  de  Linealidad  de  la  esperanza) 

(por  (107)1 ) 
(sacando  factor  común  u2) 


Por  lo  tanto,  S2  es  un  estimador  insesgado  de  cr2. 
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EJERCICIO  Eli 


1.  Comencemos  probando  la  igual  de  Sxy: 

n  n 

Sxy  =  22^Xi  -  x)(Vi  -  y)  =  22  (XiVi  ~  Xyi  ~VXi  +  X  y) 
2=1  2=1 

n  n  n 

=  22  XiVi  -  x22Vi  -  v22Xi  +  n  x  y 

2=1  2=1  2=1 

n 

=  22  xíVí  -nxy-  jlatx  + 

2=1 

n 

=  22  xíVí  ~nxy 


(distribuyendo) 

(distribuyendo) 


pues  y ^Xj=nx  y  y ^yi  =  ny 
\  2=1  2=1  / 


2=1 


Siguiendo  los  mismos  pasos  se  llega  fácilmente  a  Sxx  =  22  x2  —  n  x2  y  Syy  =  22  Vi  ~~  n  V2  ■ 


i=  i 


¿= i 


(C.8) 

(C.9) 


n  2  n  2 

Veamos  que  Srr  =  ^2/2  —  (/3o  +  /3i£¿)^  =  ^2/2  —  /3o  —  Pix^j  se  mimimiza  cuando 

2=1  2=1 

_  ^  ^  s 

/3o  =  y  —  f3ix  y  /3i  =  Realicemos  las  derivadas  parciales: 

XX 

aq  n  /  n  n  \ 

— ^  =  X]  (2(2/*  -  A)  -  Aa;¿)(-1))  =  “2  yi  ~  nA)  -  &  22  Xi) 
dfio  “í  \¿=í  S  / 

^  n  /  n  n  n 

— =  22  (2(y¿ _  A)  -  Axí)(~xí)')  =  -2  í  y)  y-i^i  -  do  22x%~  &  V a 

C'Pl  2=1  \  2=1  2=1  2  =  1 

Igualando  las  derivadas  parciales  a  cero,  en  la  ecuación  (ESI)  tenemos  que: 

n  n 

22  y*  -  nP°  -Pi22Xi  =  ny~  n^° -  ^inx  =  0 
2=1  2=1 

o  equivalentemente: 

y  -  Ai  -  Ale  =  o 

y  despejando  obtenemos  que 

Ao  =  y-  Pix 

En  la  ecuación  E3  tenemos  que: 

n  n  n  n  n 

22 yiXi  ~^o22xí~^i22xí  =22 yiXi  ~  p°nx  ~  &  22  =  0 
2=1  2  =  1  2=1  2=1 

y  reemplazando  (IC.10D  en  (IC.lll)  obtenemos: 


(C.10) 


(C.ll) 


i= 1 


^ 2/¿e¿  -  (y  -  dix)nx  ~Pi22 xi  =  0 


¿=i  *= i 

o  equivalentemente,  sacando  factor  común  /3i  y  utilizando  las  igualdades  de  Ay  y  Sxx  antes 
demostradas,  tenemos: 

n  /  n  \ 

22 yiXi  - ynx  ~  A1  ( )  =  sxy~  diSxx  =  o 

2=1  \  2  =  1  / 


^  5 

y  despejando,  finalmente  obtenemos  que  A  =  — ^ . 
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EJERCICIO  B2 


Para  el  modelo  de  regresión  lineal  simple  Y¡,  =  /3o  +  /3i cc¿  +  e¿,  i  =  1 ,n  bajo  las  siguientes 
hipótesis: 


•  E(ei)  =  0,  i  =  1, . . .  ,n, 

•  var(ei)  =  a2,  i  =  1, . . . ,  n,  y 


•  e¿  y  Cj  son  independientes  entre  sí,  con  i  ^  j, 
se  obtiene  que,  las  v.a.  son  independientes  entre  sí  y: 

E(Yi)  =  E(/3q  +  /3iXí  +  e¿)  =  /30  +  Alíe,  +  E(e  ¿)  =  /30  +  /3icc. 

(1)  1  1  a  \  (2) 


/  1  \  1  1 

£(F)  =  £  -  -  -  E  W)  =  -  S(A)  +  01*0  =  /3o  +  /3ix 


(3) 

var(Yi)  =  var(/3o  +  +  e¿)  =  ?;ar(e¿)  =  a 


2=1 

_2 


(C.12) 

(C.13) 

(C.14) 


donde  en  (1)  se  utilizó  la  Propiedad  de  Linealidad  de  la  esperanza,  en  (2)  se  utilizaron  las  igualdades 
E"=i  /3o  =  n(30  y  E"=i  Xi  =  nx  y  en  (3)  es  por  (|2.10¡) 

Comencemos  probando  que  /3i  es  un  estimador  insesgados  de  : 


E^  =  E(^)  = 


*= i 


& 


& 


^{Xi-  x)(E(Yi)  -  E(Y)) 


2=  1 


n 

^2(xí  -x)(jtó  +  ¡3iXi  -  (p6  +  /3ix)) 


=  /3i 


(definición  de  Sxy ) 
(Prop.  de  linealidad  de  la  esperanza) 
(den  y  (EH) 
(factor  común  /3l) 
(definición  de  Sxx ) 


Ahora  demostramos  que  /3o  es  un  estimador  insesgados  de  /3o : 

¿3 (/3o)  =  33  —  /3i cc^  =  E(Y)  —  E(¡3\)  x  (por  Prop.  de  linealidad  de  la  esperanza) 

=  (/3o  +  J3í&)  ~  =  /3o  (p  or  (1C.  131)  y  por  ser  /3i  insesgado) 

Así  queda  demostrado  (18. di) 

Para  llegar  a  la  expresión  de  la  varianza  de  /3o  necesitamos  expresar  a  este  estimador  de  otra 
forma  equivalente,  como  combinación  lineal  de  las  Y¿: 


.  i  _ n  c 

Po=Y-p1x=~Y/Yi-x^ 

71  ¿ ^  S 


i=  1 


=  ¿  ñ  Yi  ~  ^Xi  ~  x^Yi 


2  —  1 


2=1 


=  51  (  -  x)yi 


2=1 


=  ^  ^  ~  ]  y;. 


¿=i 


5. 


(definiciones  de  Y  y  /fi) 
(expresión  Sxy ) 
(juntando  en  una  sumatoria) 
(factor  común  Y/) 
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Ahora  sí  calculemos  la  varianza  de  /3q: 


var  (/3o)  =  var 

n 

=  £ 


El  1  x(xí  -  x) 

l  ñ  zz 


í= 1 


,¿= 1 

1  x(Xi  —  x) x  2 


f 


5. 


var 


(*)=£ 


1  a;)N  2 


2  j 


T=1 
2 ™\2 


E/  1  1x(x¿-j:)  (  x2(xí~  x) 

'  n2  n 


*5, 


S 2 


ETl  1  Ti  _ /  _ \  Ti  O  /  _ \  O 

_1 _ o  1  x\Xj  —  x)  1  X  ( Xi-xy 


i= 1 
1  X 


V  ni  2nSxx ^ 
2  f  1  x2 

( n  SÍ 


Sxx 

£(f 


X2 


02 
xx  i=  1 


02  / 

o  ¡ex  J 

n 

£(f  -*)5 


-  +  £ 

^  *5xa: 

Finalmente  calculemos  la  varianza  de  /3i¡ 


02 

¿=i 


-i  71  2  n 

£z¿  -  Z»  v  =  ¿(®*  -  ^)2 


02 

i=l 

=  W^=f 

oh  ^xx 


02 

“  i=l 


(033  y  Eli) 

(resolviendo  el  cuadrado) 


-  x)  =  O 


v*=l 


'■(/3i)  =  var  f  =  var  ( ¿(z¿  -  x)(F  -  Y) )  ( 

X&xx  /  \^xx  J 

/  1  n  \  1  71 

=  uar  —  y^(x¿  -  z)Y¿  =  ^(xí  -  xfvar/Y, ) 


por  definición  de  Sxy ) 
(por  (*)  y  por  (12. 101)) 
(por  (IC.14I)) 
(por  definición  deSZ) 


donde  en  (*)  y^(a;¿  -  x){Yi  ~  Y)  =  y]( Xi  -  x)Yi  -  Y  ^(xi  -  x)  =  ^( Xi  -  x)Y¿. 

Í—1  í=  1  %—  1  i=  1 

Por  lo  tanto,  queda  demostrado  (18.41) . 
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